您的当前位置:首页 > 科技 > 最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一 正文
时间:2026-01-11 06:22:34 来源:网络整理 编辑:科技
5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新
5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!
豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。

来自SuperCLUE
汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。
SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。
她健康无国界,自由点工厂溯源之旅架起全球女性健康桥梁2026-01-11 12:55
618电视焕新指南:三星Neo QLED、OLED 及 Lifestyle 系列引领生活方式全面升级2026-01-11 12:52
武汉医疗器械展精彩回顾!Kiwa(琦威)MDR专题培训成为一大亮点2026-01-11 12:07
“萌宠专列”启程,公共服务进阶的温情刻度2026-01-11 12:02
北京时代瑞程新能源科技有限公司简介2026-01-11 11:55
汇通信诚车主融:技术赋能构建高效安全融资新生态2026-01-11 11:42
平潭馆亮相第二十届海峡旅游博览会2026-01-11 11:39
在帆书APP遇见莎士比亚:李蕾带你解码喜剧背后的人性镜像2026-01-11 11:24
南上海装饰联盟正式成立 共筑家装诚信进展新生态2026-01-11 10:59
监督触角向“八小时外”延伸2026-01-11 10:20
携爱同行,善创将来|光晨科技获评广州扬爱2024年“公益先锋”2026-01-11 12:06
青春化学 活力成达 实干争先2026-01-11 12:06
中移物联OneZone智慧社区方案亮相首届广州国际智能建造与工业化建筑产业博览会2026-01-11 11:49
与粽不同,大董先生私藏同款2026-01-11 11:26
360保证云“渗透测试超级智能体V2.0”重磅升级!助力“攻防演练”2026-01-11 11:25
“萌宠专列”启程,公共服务进阶的温情刻度2026-01-11 11:09
创历届规模之最 2025北京国际印刷技术展今日开幕2026-01-11 11:07
新商DOU来赚!第二季度新商家政策来啦2026-01-11 11:00
国家队的“金牌保证” 优形持久八年入围“营养国家队”2026-01-11 10:44
新商DOU来赚!第二季度新商家政策来啦2026-01-11 10:41