Skip to main content

AI Daily Digest: Agent 成功率暴增 12%→66%,RL 奖励作弊检测新方法 - 2026/04/20

· 6 min read
Yi Wang
Full Stack & AI Engineer

Stanford 2026 AI Index 发布最新数据:AI Agent 任务成功率从去年的 12% 跃升至 66%,AI Agent 相关网络流量暴增 7,851%。与此同时,arXiv 本周论文聚焦 AI 安全审计和 RL 奖励作弊检测,Google 发布机器人领域新模型,Docker 公开其 Agent 沙箱架构。

The Agent Layer Is Hardening: OpenAI Sandboxes, Anthropic's Advisor Pattern, and the Protocol Wars Are Over

· 9 min read
Yi Wang
Full Stack & AI Engineer

April 16, 2026. The AI agent ecosystem just had one of its most consequential 72-hour windows of the year. OpenAI restructured how agents interact with compute. Anthropic published a new cost-efficiency architecture and shipped Claude Cowork to GA. Microsoft unified its fractured agentic SDKs. DeepSeek V4 is days away. And across developer communities, the backlash against unreliable agents is getting louder.

This is not hype. This is infrastructure. The agent layer is hardening.

转码记录 Vol.04 | 25 Fall:OS、数据库、网络,三个系统方向同时打通

· 16 min read
Yi Wang
Full Stack & AI Engineer

从 24 Fall 开始算,这是第四个学期。前三个学期的路径:打数学和逻辑基础,自学从 Python 到 RISC-V 汇编的完整栈,动手实现 CPU、写 C、做全栈项目。这学期是系统软件层的集中展开:操作系统、数据库、网络三个方向同步推进,配合 MIT 6.S081、Berkeley CS 186、CS 168,加 Redis 工程实践和一个从零上线的 Agent 应用。

转码记录 Vol.03 | 25 Summer:三门硬核课 + 全栈 AI 项目上线,这学期造了一个 CPU

· 11 min read
Yi Wang
Full Stack & AI Engineer

上学期(25 Winter)的自学集中在理解层面。这学期开始验证理解和动手之间的差距。三门校内课:EECS 2021 要求用 Verilog 亲手实现一个能跑 RISC-V 指令的 CPU;EECS 2031 用 C 语言处理系统编程任务;EECS 2030 深入到面向对象的实现者视角。课外还做了 Spring Boot + React 的全栈 AI 项目,从零走到 Docker 部署上线。

转码记录 Vol.02 | 25 Winter:校内三门 + 自学四门,这学期开始有了层次感

· 11 min read
Yi Wang
Full Stack & AI Engineer

上学期(24 Fall)用三门课完成热身。这学期开始不一样了:校内三门课 + 自学四门课同步推进,工作量直接翻倍。CS 61A、CS 61B、CS 61C、Nand2Tetris——技术知识开始有了层次感,从 NAND 门到高级语言的完整链路第一次在脑子里贯通。

转码记录 Vol.01 | 从文科硕士到 CS 二学位,第一个学期的实况

· 7 min read
Yi Wang
Full Stack & AI Engineer

文科硕士毕业,做了几年数据分析师。流程熟了之后,开始意识到一件事——我会用工具,但不懂工具背后的逻辑。能调 API,但不理解 HTTP 请求的完整链路;会写 Pandas,但遇到性能瓶颈只能靠 Stack Overflow。岗位天花板不是薪资,是你能解决的问题的复杂度上限

这是决定读 CS 二学位的第一学期复盘。