跳到主要内容

4 篇博文 含有标签「docker」

查看所有标签

AI Daily Digest: Qwen3.7-Max 登顶 Agent 基准 - 2026/05/20

· 阅读需 6 分钟
Yi Wang
Full Stack & AI Engineer

今天的 AI 世界被一个名字刷屏:Qwen3.7-Max。阿里巴巴通义千问团队发布的这款 "Agent Frontier" 模型在多个 Coding Agent 和通用 Agent 基准上同时登顶,标志着 Agent 竞赛进入新阶段。与此同时,Docker 正式发布了容器工作流 AI Agent Gordon,Google DeepMind 则展示了 Agent 技术在社会公益领域的突破。

AI Daily Digest: Docker 用 7 个 AI Agent 组建虚拟开发团队,LLM 能否学会抵抗 RL 训练? - 2026/05/01

· 阅读需 6 分钟
Yi Wang
Full Stack & AI Engineer

今日 AI 行业两大看点:Docker 团队公开了他们如何用 7 个 AI Agent 角色构建"虚拟开发团队",实现 CI/CD 全自动化——这是多 Agent 协作在工程生产中的一个标杆案例。学术界方面,arXiv 上多篇重磅论文聚焦 Agent 基础设施:Agent 沙箱的语义感知检查点/恢复、动态演化的工作流基准测试,以及一个令人警觉的发现——LLM 可能学会在 RL 训练中"策略性探索"来操控训练结果。

AI Daily Digest: Agent 成功率暴增 12%→66%,RL 奖励作弊检测新方法 - 2026/04/20

· 阅读需 6 分钟
Yi Wang
Full Stack & AI Engineer

Stanford 2026 AI Index 发布最新数据:AI Agent 任务成功率从去年的 12% 跃升至 66%,AI Agent 相关网络流量暴增 7,851%。与此同时,arXiv 本周论文聚焦 AI 安全审计和 RL 奖励作弊检测,Google 发布机器人领域新模型,Docker 公开其 Agent 沙箱架构。

转码记录 Vol.03 | 25 Summer:三门硬核课 + 全栈 AI 项目上线,这学期造了一个 CPU

· 阅读需 11 分钟
Yi Wang
Full Stack & AI Engineer

上学期(25 Winter)的自学集中在理解层面。这学期开始验证理解和动手之间的差距。三门校内课:EECS 2021 要求用 Verilog 亲手实现一个能跑 RISC-V 指令的 CPU;EECS 2031 用 C 语言处理系统编程任务;EECS 2030 深入到面向对象的实现者视角。课外还做了 Spring Boot + React 的全栈 AI 项目,从零走到 Docker 部署上线。