跳到主要内容

26 篇博文 含有标签「ai」

查看所有标签

AI Daily Digest: Agent 成功率暴增 12%→66%,RL 奖励作弊检测新方法 - 2026/04/20

· 阅读需 6 分钟
Yi Wang
Full Stack & AI Engineer

Stanford 2026 AI Index 发布最新数据:AI Agent 任务成功率从去年的 12% 跃升至 66%,AI Agent 相关网络流量暴增 7,851%。与此同时,arXiv 本周论文聚焦 AI 安全审计和 RL 奖励作弊检测,Google 发布机器人领域新模型,Docker 公开其 Agent 沙箱架构。

AI Daily Digest: Claude Opus 4.7 登顶,OpenAI 进军生命科学,Mozilla 掷出 Thunderbolt - 2026/04/17

· 阅读需 7 分钟
Yi Wang
Full Stack & AI Engineer

2026 年 4 月 17 日,AI 行业经历了又一个密集发布日:Anthropic 的 Claude Opus 4.7 在 14 项基准测试中赢了 12 项,OpenAI 发布了首个生命科学专用模型 GPT-Rosalind,Mozilla 则用开源的 Thunderbolt 向企业 AI 发起了挑战。

上下文工程:AI 的战略级内存 (RAM)

· 阅读需 10 分钟
Yi Wang
Full Stack & AI Engineer

在生成式 AI 革命的早期,整个行业都沉迷于“参数量”。我们通过模型神经架构中数以十亿计甚至万亿计的权重来衡量进度。但到了 2026 年,共识已经发生了转变。站在 Gemini 3.0 和 Claude 4 的时代,我们意识到,如果没有高保真、低延迟的“工作记忆(Working Memory)”,原始的智能是毫无用处的。

欢迎来到**上下文工程(Context Engineering)**时代。如果说大语言模型(LLM)是 CPU,那么上下文就是 RAM。正如在传统计算中一样,我们管理这种“内存”的方式,定义了系统实际能够完成的任务上限。