格隆汇11月19日|在本月初离开Meta后,现代AI基础设施领域最具影响力的人物之一Soumith Chintala宣布正式加入前OpenAI技术长Mira Murati创办的初创公司Thinking Machines ...
北京时间11月14日,据彭博社报道,知情人士称,OpenAI前首席技术官(CTO)米拉穆拉蒂(Mira Murati)建立的AI创业公司Thinking Machines Lab正就新一轮融资进行早期谈判,估值约达500亿美元。
「我不想一辈子只做PyTorch,」他在离职信中写道,字里行间透着一种对创造力的饥渴,「我不想像Linus Torvalds(Linux之父)或Guido van Rossum(Python之父)那样,几十年如一日地被绑定在同一个项目上。」 ...
这篇博客的主要作者是前 OpenAI 研究员 Kevin Lu,与 Thinking Machines 团队合作完成,他曾领导 GPT-4o mini 发布,并参与了 o1-mini、o3、GPT-5 等多个重要模型的研发。他的出手,分量十足。
近期,AI界传出了一则重量级人事变动消息,OpenAI痛失了一位在小模型和强化学习领域颇具影响力的研究员——Kevin Lu。 Kevin Lu毕业于UC伯克利,专攻强化学习和离线序列数据建模。他的职业生涯起步于Hudson River Trading,随后转战meta。2024年3月,他加入了OpenAI,并 ...
在策略蒸馏是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。 刚刚,不发论文、爱发博客的 Thinking Machines Lab (以下简称 TML)再次更新,发布了一篇题为《在策略蒸馏》的博客。 在策略蒸馏(on-policy distillation)是一种将强化学习 (RL) 的 ...
刚刚,不发论文、爱发博客的 Thinking Machines Lab (以下简称 TML)再次更新,发布了一篇题为《在策略蒸馏》的博客。 在策略蒸馏(on-policy distillation)是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时 ...
第一财经研究院发布的12月“第一财经首席经济学家信心指数”为50.72,维持景气状态,以年内较高位置收官2024年。第一财经首席调研结果显示,前期一揽子政策效果正不断显现,四季度经济逐步企稳向好。中央经济工作会议将更关注发展新质生产力、扩大内需、巩固房地产市场、深化改革以及对外开放等领域,延续稳增长基调。