他们提出AgentFlow框架采用模块化架构,通过4个专门化智能体协同工作,配合专门设计的Flow-GRPO算法,使系统能够在真实交互环境中持续优化决策策略。
安全研究人员正利用大语言模型实现侦察自动化、逆向工程API,并以前所未有的速度扫描代码库。通过将AI工具应用于从模糊测试、漏洞利用自动化到跨代码库和网站的模式识别等各种技术,研究人员正以更快的速度发现漏洞。
在AI时代,莫让大脑「裸泳」!认知卸载如计算器取代心算,久之忘本。莫等AI断供,才悔恨脑子空空。 所有人都在加速拥抱AI,却几乎没人追问:它把我们的大脑变成什么? X用户Alex ...
这套「大规模长视频预训练 + 大规模多模态RL」的组合拳,被王仲远称为继语言模型预训练、后训练之后的「第三种Scaling范式」。它指明了一条道路:通过不断增加视频数据、模型参数和算力,多模态世界模型的能力将可预见地持续提升。
中国人民大学高瓴人工智能学院与快手 Klear 语言大模型团队联合提出 Agentic Entropy-Balanced Policy Optimization(AEPO),一种面向多轮智能体的熵平衡强化学习优化算法。 在智能体强化学习的快速发展中,如何在探索与稳定之间取得平衡已成为多轮智能体训练的关键。
NTU联合StepFun提出了IGGT (Instance-Grounded Geometry Transformer) ,一个创新的端到端大型统一Transformer,首次将空间重建与实例级上下文理解融为一体。 人类能自然地感知3D世界的几何结构与语义内容 ,但对AI而言,这“两者兼得”一直是巨大挑战。 传统方法将3D重建 ...
你的数据是你最宝贵的资产;一旦数据脱离你的掌控,你可能并不清楚其使用方式。许多AI供应商希望利用客户数据来训练和完善其模型。除非你的第三方合同明确限制这一点,否则敏感信息可能会进入你无法管控的系统,甚至嵌入到使竞争对手受益的模型中。AI应用场景缺乏透 ...
在那之前,他是Google Brain的研究员,推动了Chain-of-Thought推理、Instruction Tuning(指令微调)等技术的发展。
当年靠Sora惊艳世界的天才辍学生回来了,这次他要直奔超级人工智能而去。问题是,这次他到底在造什么? Sora背后的核心贡献者之一,这位00后的天才辍学生Will Depue,准备再次搞个大事情。 刚刚,他宣布下一个目标是,超级人工智能ASI! 在结束一段长期休息后,Will Depue宣布他再次回到OpenAI。 并且这次拉上了另外两位年轻的工程师Troy Luhman和Eric Luhman, ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果