新智元报道编辑:桃子LRS哈佛斯坦福MIT等机构首次提出「精度感知」scalinglaw,揭示了精度、参数规模、数据量之间的统一关系。数据量增加,模型对量化精度要求随之提高,这预示着AI领域低精度加速的时代即将结束!就连「量化」也不管用,scalinglaw真的要终结了吗?一...
新智元报道编辑:Aeneas好困卷到没边了,122天交付10卡超算,马斯克造Colossus的神奇速度,直接把对手们干懵逼了!OpenAI和微软甚至因此谈崩了。现在,超算大战干脆升级为谍战模式,对手直接派出飞机悬空侦查。122天交付10万卡超算,神奇的「马斯克速度」,直接把...
新智元报道编辑:桃子2024年谷歌博士奖学金名单揭晓了!今年,整个获奖华人学者中,来自新加坡国立大学的人数占绝大多数,另有清华姚班大神吕欣、开创性KAN论文一作入选。一年一度谷歌博士奖学金(GooglePhDFellowship),终于公布了!今年,谷歌博士生奖学金名单显示,今年共...
新智元报道编辑:Aeneas好困最近,Nature上的一项研究,全面驳斥了LLM具有类人推理能力的说法。研究者设定的「人类亲吻难题」把7个大模型彻底绕晕。最终研究者表示,与其说LLM是科学理论,不如说它们更接近工具,比如广义导数。LLM究竟是否拥有类似人类的符合理解和推理能力...
新智元报道编辑:LRS通过过程奖励模型(PRM)在每一步提供反馈,并使用过程优势验证器(PAV)来预测进展,从而优化基础策略,该方法在测试时搜索和在线强化学习中显示出比传统方法更高的准确性和计算效率,显著提升了解决复杂问题的能力。在提升大型语言模型(LLM)在数学推理方面的能力时,一个常用的方...
西风发自凹非寺量子位公众号QbitAIkimi全面开放一周年之际,创始人杨植麟亲自发布新模型——数学模型k0-math,对标OpenAIo1系列,主打深入思考。在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview...
RouterDC团队投稿量子位公众号QbitAI高效组合多个大模型“取长补短”新思路,被顶会NeurIPS2024接收。名为RouterDC,是一种基于双重对比学习的路由架构,具有参数高效性(小于100M的参数)和计算高效性(不需要对于LLM进行梯度回传)的优势。在具有挑...
克雷西发自凹非寺量子位公众号QbitAI大模型的具身智能决策能力,终于有系统的通用评估基准了。李飞飞吴佳俊团队新提出的评估框架,对具身智能决策的四项关键子能力来了个全面检查。这套基准已经被选为了NeurIPS数据和测试集(D&B)专栏Oral论文,同时也被收录进了PyPI,只要一...
克雷西发自凹非寺量子位公众号QbitAIChatGPT客户端,支持“读屏编程”了。即日起,Mac端的Plus用户,可以直接让ChatGPT客户端读取开发工具中的代码。目前,包括常用的Xcode和VSCode在内,该功能一共支持五款编程工具。网友MckayWrigle...
奇月发自凹非寺量子位公众号QbitAI鹅厂全家桶,被大模型打通的进度+1(手动狗头)。元宝2.0大更新,不仅新增AI应用专属模块,把搜索、阅读、生图都整合到了一起。甚至连腾讯文档、电脑管家和搜狗输入法都被他们打通了。这AI助手真是越来越懂事了。有很多网友也反馈说体验很好:...
奇月发自凹非寺量子位公众号QbitAI现在,随便丢给机械手一个陌生物体,它都可以像人类一样轻松拿捏了——除了苹果,罐头、乐高积木、大象玩偶、骰子,都不在话下:这就是来自MetaFAIR团队最新的NeuralFeels技术,通过融合触觉和视觉,机械手可以更精确地操作未知物体,精度最高...
西风发自凹非寺量子位公众号QbitAI马斯克新官上任,也是OpenAI董事会内讧将近一周年之际,重启对OpenAI的诉讼。修改后的诉状增加新的指控!告他们涉嫌不正当竞争,用给员工支付巨额薪酬等方式垄断生成式AI市场。而且这次马斯克还将微软一并送上法庭,领英联合创始人/微软董事...
《投资者网》王健凡一场意外的仲裁,打破了中国AI圈的平静。11月11日,一则消息在科技圈内迅速发酵:国内AI领域炙手可热的明星企业——Kimi母公司月之暗面,陷入了一场出人意料的法律纠纷。其创始人杨植麟和联合创始人兼CTO张宇韬被卷入一场源自他们“前世”的纷争。这场仲裁的发...
11月16日下午消息,月之暗面KimiChat面向全社会开放服务一周年之际,月之暗面宣布推出新一代数学推理模型k0-math。基准测试显示,在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过OpenAIo1系列的o1-m...
阿里巴巴(NYSE:BABA;HKEX:9988)发布了截至9月30日的2025财年第二财季财报:营收为2365.03亿元,同比增长5%。净利润为435.47亿元,同比增长63%;不按美国通用会计准则,净利润为365.18亿元,同比下滑9%(注:阿里巴巴财年与自然年不同...
11月16日下午消息,月之暗面KimiChat面向全社会开放服务一周年之际,月之暗面宣布推出新一代数学推理模型k0-math。基准测试显示,Kimik0-math的数学能力可对标全球领先的OpenAIo1系列可公开使用的两个模型:o1-mini和o1-preview。在...
文新浪科技周文猛在吴泳铭接管阿里云一年之后,伴随昨晚阿里巴巴集团公布新季度(2024年7-9月)业绩报告,阿里云也迎来了吴泳铭管理之下的周年“大考”。据业绩报告,本季度,阿里云收入296.1亿元,同比增长7%,对比上一季度265.49亿元,环比增长11.5%;在利润表现方面,阿里云...
文新浪科技罗宁11月15日,阿里巴巴集团发布2025财年Q2财报,季度收入2365.03亿元,同比增长5%,符合市场预期。盈利指标方面,本季度实现净利润435.47亿元,同比增长63%;经调整EBITA同比下降5%至人民币405.61亿元,主要归因于对电商业务...
仰望U7一共有多少台电机?在今天开幕的广州车展里,仰望汽车为我们公布了答案——10台。你没有看错,就是10台,而且它们均直接作用于轮端的电机,而那些驱动雨刷、座椅的电机并不计算在内。▲仰望U7EV但不要误会,仰望U7的这些电机并非全部源自它的驱动系统易四方,部分电机还来自于...
Valve于2004年11月16日发布了备受瞩目的FPS游戏《半条命2》。很多玩家惊讶的发现,玩《半条命2》需要同时安装另一款叫Steam的软件。《半条命2》不是在Steam上发布的第一款Valve游戏,但它是第一款必须要安装Steam的著名游戏,即使实体零售版也是...
OpenAI在9月完成了内部代号Orion的新大模型的初步训练,该公司希望新模型能大幅超越旧版本。但内部人士透露训练结果并未达到预期,性能与现有模型相差不大。OpenAI不是唯一一家遭遇瓶颈的公司。Google的Gemini模型新版本也未达到预期。Anthropic推迟了其大模型...
一项全球调查显示,高管们对AI仍然十分热衷,但办公室员工对其热情在逐渐降温,全世界对AI的热情下降了6个百分点。2023年9月到2024年3月,全球AI普及率从20%增长到32%,但过去三个月普及率开始停滞,法国仅增长了两个百分点,从31%增加到33%;美国...