

 写点什么

软件工程

 关注

收录了软件工程频道下的 12528 篇内容
以工程化的思维看待软件研发，关注与敏捷、提效、安全等要素相关的创新实践，关注最新研发理念、工具的布道与落地

全部
安全
AIOps
BizDevOps
DevOps & 平台工程
FinOps
研发效能
可观测
其他

从测试驱动开发和生产环境测试中获得反馈

Ola Hast 和 Asgaut Mjølne Söderbom 在他们在伦敦 QCon 关于结对编程的持续交付的演讲中提到，团队依赖于强大的单元测试和集成测试，而不是端到端的测试。使用 TDD（测试驱动开发）、结对编程和良好的设计，他们经常发布小的更改，在生产环境中测试真实的反馈，并使用功能开关来降低风险。

作者 : Ben Linders 译者: 刘雅梦

10 小时前

1492

谁写的代码谁负责！Cursor 发布 Agent Trace：从此 Bug 别想再推给 AI

Agent Trace：Cursor 提出 AI 代码归属的开放规范。

作者：Robert Krzaczyński 译者: 田橙

02-05

5700

Cookie 真的要被淘汰了？IEEE 推出 MyTerms，新隐私规则开始反杀互联网

点了 20 年「我已阅读并同意」，这次可能真要结束了。

作者 : Sergio De Simone 译者: 田橙

02-03

4937

百度端侧大模型安全建设实践：在算力与保障之间找到平衡

本文分享了 AI 从云端向终端延伸的背景与驱动力以及端侧小模型的兴起与生态布局，以及在低算力情况下最大限度的满足端侧内容审核的效果。通过分享百度在端侧大模型安全建设的思路，做到离线场景低算力情况下依旧可以支持多模安全审核，帮助听众开拓了一些新思路。

作者：李志伟策划: Kitty

02-03

4582

容器可观测新视角： SysOM 延时抖动监控助力定位业务抖动原因

在云原生场景中，为了最大化资源利用率，越来越多的集群采用资源超卖策略和混合部署方式。然而，这种模式在提升集群效率的同时，也显著增加了宿主机与容器化应用之间的资源竞争风险。

作者 : 肖杰韬

02-03

4155

100 毫秒不是优化，是信仰：顶级工程团队如何“设计”极速 API

低延迟不是优化技巧，而是系统性设计结果。

作者：Saranya Vedagiri 译者: 田橙

02-02

4457

为什么你的系统一出事就“查不清”？Railway 给出可观测性的标准答案

Railway 发布可观测性实践指南，系统阐述日志、指标、追踪与告警的协同价值，帮助工程团队更高效地定位和诊断生产系统故障。

作者：Craig Risi 译者: 田橙

01-31

6740

DoorDash 通过多臂老虎机增强 A/B 测试

DoorDash 工程师 Caixia Huang 和 Alex Weinstein 说，尽管实验至关重要，但传统 A/B 测试可能过于缓慢且成本高昂。为了消除这些限制，他们采用了“多臂老虎机”（MAB）方法来优化实验。

作者 : Sergio De Simone 译者: 平川

01-30

5794

Ramp 构建的内部编码代理支撑着 30% 的工程拉取请求

Ramp 分享了 Inspect 的架构。在公司前后端存储库的合并拉取请求中，这个内部编码代理的采用率迅速达到了约 30%。

作者：Claudio Masolo 译者: 平川

01-30

5776

半年处理 1 亿笔支付！x402 V2 升级，让支付更简单

开放支付标准 x402 迎来重大升级，能力边界全面扩展。

作者 : Sergio De Simone 译者: 田橙

01-29

4269

DoorDash 运用 AI 提升聊天与通话安全，将安全事件减少 50%

DoorDash 构建并部署了一个 AI 驱动的安全系统 SafeChat，用于审核配送员与顾客在应用内聊天、发送图片及进行语音通话时的互动内容

作者：Leela Kumili 译者: 平川

01-27

4252

面向 SRE 的人本 AI：多智能体事件响应

根据 OpsWorker（代理 AI 同事即服务）的博文，企业的站点可靠性工程实践正在悄然发生转变。团队不再是简单地将故障告警发送给一台机器，而是设计出能与值班工程师协同工作的多智能体 AI 系统。

作者：Matt Saunders 译者: 平川

01-26

3102

AI Agent 是长期运行的“风险系统”，如果你还只在防 Prompt Injection，说明已经落后一代了

CyberArk 如何通过指令检测与历史感知校验机制保护 AI Agent。

作者：Sergio De Simone 译者: 田橙

01-26

4859

在美国法律管辖权受到质疑之际，亚马逊云科技推出了欧洲主权云服务

亚马逊云科技（AWS）已将其欧洲主权云服务（European Sovereign Cloud）推向全面可用，该服务在物理和逻辑上分离的基础设施上投资了 78 亿欧元。该服务现已在德国勃兰登堡州提供，旨在应对欧洲的监管要求以及对美国访问数据的日益增长的地缘政治担忧。尽管 AWS 强调，该云服务将完全由欧盟居民在新的德国母公司结构下运营，但关于这种分离是否真的能抵御美国政府的数据请求，仍存在重大疑问。

作者 : Steef-Jan Wiggers 译者: 刘雅梦策划: 丁晓昀

01-23

8479

揭秘 Uber 跨区域数据湖与灾难恢复机制：350PB 数据、数百万事件、单一系统

Uber 构建了 HiveSync，这是一个分片式批量复制系统，能够使 Hive 和 HDFS 数据在多个区域之间保持同步，它每天处理数百万个 Hive 事件。

作者：Leela Kumili 译者: 平川

01-22

9540

解决移动分析碎片化困局：Uber 的平台引领之道

为了标准化 iOS 和 Android 平台的事件工具，Uber 工程团队重新设计了其移动分析架构，解决了所有权分散、语义不一致和跨平台数据不可靠的问题。

作者：Leela Kumili 译者: 平川

01-19

6164

QCon 北京 2026 启动｜Agentic AI 时代的软件工程重塑

欢迎你带着真实问题与实践加入其中，与更多同行一起，把这场正在发生的软件工程重塑讲清楚、做扎实。

作者 : Kitty 策划: QCon全球软件开发大会

01-15

9364

Cloudflare 通过左移安全实践扩展基础设施即代码

Cloudflare 通过实施基础设施即代码和自动化策略执行，消除了数百个生产账户中的手动配置错误，每天处理大约 30 个合并请求，并在部署前而不是事件发生后捕捉安全违规。

作者 : Tim Anderson 译者: 刘雅梦策划: 丁晓昀

01-14

7352

测试人员可以做些什么来确保软件安全

Sara Martinez 在 Online TestConf 上的演讲“确保软件安全”中说到，一个安全的软件开发生命周期意味着将安全融入到计划、设计、构建、测试和维护各个阶段，而不是在最后阶段才匆忙添加。

作者 : Ben Linders 译者: 刘雅梦策划: 丁晓昀

01-12

6642

米其林以务实路线迈向 AIOps，并无宏大愿景

米其林中国运维集团写了一篇关于他们如何实施 AIOps 平台的文章。文章详细描述了在最终与全球 IT 治理对齐的过程中克服的失误和组织阻力，并解释了企业如何能够超越供应商的推销，实现实际部署。

作者：Matt Saunders 译者: 刘雅梦策划: 丁晓昀

01-01

10054

谷歌 Metrax 为 JAX 引入了预定义的模型评估指标

Metrax 是一个 JAX 库，最近由谷歌开源，为分类、回归、自然语言处理（NLP）、视觉和音频模型提供了标准化的性能指标实现。

作者 : Sergio De Simone 译者: 刘雅梦策划: 丁晓昀

2025-12-24

6508

亚马逊云科技推出“DevOps Agent”，以实现事件响应自动化并提高系统可靠性

亚马逊云科技（AWS）最近宣布了 AWS DevOps Agent 的公开预览版，这是一种新的“前沿智能体”，旨在帮助组织更快地应对生产故障，识别根本原因，并主动加强系统可靠性。该服务被定位为一个自治的、随时待命的值班工程师，它与现有的可观测性、部署和工单工具集成，以自动化许多传统上由 DevOps 团队手动完成的任务。

作者：Craig Risi 译者: 刘雅梦策划: 丁晓昀

2025-12-23

6075