AI每日简报 (The AI Daily Briefing)「2025-08-26」
① Sakana AI发布M2N2进化模型融合方法:在GECCO'25会议上展示的新研究,通过模拟自然进化让AI模型像生物体一样竞争、配对和融合。该方法动态演化模型边界,通过竞争促进专业化,并使用吸引力启发式智能配对,成功从零开始进化出性能媲美CMA-ES的MNIST分类器,并能将数学专家LLM与智能体LLM高效融合。
消息来源 | 论文地址 | GitHub仓库
② Andrej Karpathy分享LLM辅助编程工作流:将编程助手使用分为四个层次:75%使用Cursor代码补全,中层是高亮代码块进行修改,再上层是Claude Code处理大型功能块,最难问题使用GPT-5 Pro。强调当前是"代码后稀缺时代",可随意创建和删除数千行临时代码,但LLM仍缺乏代码品味和正确的抽象能力。
消息来源
③ Cerebras发布MoE训练调试指南:详细展示了如何解决混合专家模型训练中路由器不学习的问题,证明不需要Google规模的计算资源也能训练有效的MoE模型。通过逐步调试展示了即使负载均衡完美,路由仍可能完全无效的问题及解决方案。
消息来源 | 详细指南
④ NVIDIA发布Jetson Thor机器人计算平台:新一代强大的机器人计算机,专为通用和人形机器人设计,可为物理AI代理提供实时推理能力。早期采用者包括Agility Robotics、Amazon Robotics、Boston Dynamics、Caterpillar、Figure等公司,将应用于制造、物流、建筑和医疗等领域。
消息来源 | 详情链接
⑤ v0团队推出Agentic v0功能:Claire Vo表示,开发团队已从"永远不碰这些工具"转变为"让它们自由运行",标志着AI代理在实际开发中的信任度和能力显著提升。
消息来源
⑥ PyTorch创业展示活动开启报名:AI初创公司可获得5分钟舞台展示时间、2张PyTorchConf门票及PyTorch渠道推广机会。活动将于10月21日举行,报名截止9月14日。
消息来源 | 活动报名
⑦ Hugging Face推出免费认证课程:涵盖从LLM到扩散模型的完整内容,为开发者提供系统化的AI技术学习路径。
消息来源
⑧ Google Veo 3限时免费开放:Gemini免费用户可生成6个视频,Pro用户每日配额翻倍至6个,Ultra用户配额翻倍至10个,优惠持续至太平洋时间晚10点。
消息来源
⑨ Zed团队分享异步代理代码审查经验:将于美东时间12点直播演示如何从"这是魔法"到"搞砸了一切"再到找到最佳平衡点的演进过程。
消息来源 | 直播链接
⑩ GPT-5 mini在SEAL排行榜表现优异:在Humanity’s Last Exam和FORTRESS测试中并列第二,在EngimaEVAL和VISTA测试中并列第三,显示小型模型也能达到顶级性能。
消息来源