Math 4 - 搜索 News

18 分钟

港大突破：小模型逆向指导大模型推理

在人工智能的世界里，有一个看似违反常理的有趣现象正在发生。通常我们认为，大型语言模型应该比小型模型更聪明、更有能力，就像成年人比孩子更有经验和知识一样。然而，香港大学和芝加哥大学的研究团队最近发表了一项突破性研究，他们证明了一个令人惊讶的观点：在某些 ...

1 小时

从Puppeteer到Playwright：浏览器采集架构的破局与重生

然而，随着业务场景的复杂化，Puppeteer的“成长之痛”逐渐显现：资源争抢导致稳定性下降、反爬对抗成本飙升、多浏览器兼容性不足、代理配置繁琐……这些问题像雪球一样越滚越大，让原本简洁的采集框架变得臃肿难维护。作为一名深耕浏览器采集领域多年的开发者 ...

腾讯网

Aster 宣布千万美元交易竞赛：叠加 Stage 4 空投与 Rocket Launch 激励，多 ...

多轨激励并行：空投、竞赛与新币活动全面驱动增长去中心化交易平台 Aster 正进入高速扩张阶段。在 Stage 3 取得强劲表现后，随即上线 Stage 4（Harvest）空投计划，并将在 11 月 17 日推出总奖励达 1,000 万美元的 “Double Harvest” 交易竞赛，同时持续扩大全新产品 Rocket ...

腾讯网

让小语言模型教会大语言模型推理：香港大学提出的“师生关系 ...

5 小时

你急它不急：GPT-5先判断，再决定「速答」还是「深想」

【导读】GPT-5不再只是更聪明的模型，而是一台学会犹豫的机器。它能判断问题的难度，分配自己的思考时间，甚至决定何时该停下。OpenAI副总裁Jerry ...

小黑盒游戏 on MSN

卡神暗示今年要拿major

【本文由小黑盒作者@把棒棒糖改成烟于11月16日发布，转载请标明出处！】 KSCERATO："FalleN说他赢得Major时是26岁...我现在也26了，你懂的兄弟" 🇧🇷‼️ KSCERATO: "FalleN said he won the ...

科技行者 on MSN

谢里夫大学团队重新定义AI智能：从刷题高手到真正思考者的转变

这项由伊朗谢里夫大学计算机工程系马赫迪·萨米埃伊（Mahdi Samiei）领导的国际研究团队发表于2025年10月的突破性论文，首次提出了"复杂度分布外泛化"框架来重新定义和评估人工智能的真正推理能力。该研究发表在arXiv预印本平台（论文编号：arXiv:2510.06274v1），为理解和构建下一代AI系统提供了全新视角。有兴趣深入了解的读者可以通过该编号查询完整论文。目前的人工智能就像一 ...

十轮网科技资讯 on MSN

AI真的会推理吗？牛津重量级研究：基准测试工具可能误导判断

这项研究分析了445种不同的基准测试，这些测试被广泛用于评估AI的推理能力和编码任务的表现。研究人员发现，这些测试的结果往往无法准确反映AI模型的实际能力，部分原因在于基准测试的定义模糊，以及缺乏透明的统计方法来比较不同模型的表现。

4 天

清华团队：1.5B 模型新基线！用「最笨」的 RL 配方达到顶尖性能

从强基座起步的 JustRL-Nemotron-1.5B 表现更加出色，平均准确率达到 64.32%，略微超过使用课程学习的 QuestA（63.81%）。关键的差异在于，QuestA 需要完整的推理轨迹来构建 hint，还要分阶段调整提示难度；而 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果