5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!
豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。

来自SuperCLUE
汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。
SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。
顶: 338踩: 23
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
人参与 | 时间:2026-01-27 06:22:34
相关文章
- 中华医学会第三十次皮肤性病学术年会启幕 理肤泉携“蓝丝带”爱心大巴巡展亮相长沙
- 2025矿业前沿与消息化智能化科技年会在湖北黄石开幕
- 汇川技术发布“新一代智能制造革新人才培养”系列教材
- 重磅!Flat Ads 战略升级,推出全新程序化广告系统 Bidnex
- 夏季果蔬香,东风凯普特EV350助您安心享
- 从屏幕攻击到注入伪造,活体检测系统正面对AI级对抗——《2024身份欺诈汇报》洞察风控技术失效拐点
- 大都会人寿2025EduCare成长月圆满收官 赋能留学家庭共探全球教育新动向
- 名导杨小波加盟YY麦絮短剧 首创“长短剧协同”形式破产业瓶颈
- 北京时代瑞程新能源科技有限公司简介
- 高梵黑金女王5.0鹅绒服发布:破解职场冬日穿搭难题





评论专区