1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking ,创下数项权威评测全球新纪录。其性能媲美GPT-5.2 、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型 。
Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。
通过总参数、强化学习、推理计算的极致规模扩展 ,新模型实现了性能的大幅飞跃,刷新科学知识 、数学推理、代码编程等多项关键性能基准测试的全球纪录。
在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制 ,推理性能提升的同时还更经济。
业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论 ,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取 ”式的提炼,并据此进行多轮自我迭代 ,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果 。基于这一推理技术创新,千问推理性能和推理效率大为提升 ,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。
面向即将到来的智能体Agent时代 ,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。
具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练 ,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力 。这种自适应的工具调用能力可在QwenChat上完整体验,模型自主选用搜索 、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答 ,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。
目前 ,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。
据了解 ,千问App也即将接入新模型,所有用户都可免费体验千问最强模型 。
(文章来源:上海证券报)
证券配资的条件:可转债配资业务-【西街观察】商业航天IPO标准定向扩围,资本与科技的又一次双向奔赴
最好的配资平台:个股配资-多项业务行业第一!国泰海通上半年净利增逾213%至157亿 超越中信证券
合法正规的配资平台:好的股票配资平台-马斯克带领xAI团队发布Grok 4 “全球最强模型”含金量如何?
杠杆炒股配资:正版炒股软件-天风证券孙潇雅8月份现身多家上市公司 这些公司均涉及机器人业务
可转债配资业务:股票配资开户平台-华泰证券:火电三季度盈利有望提升 绿电国补回收提速
配资平台网站:可转债配资业务-12月11日国内四大证券报纸、重要财经媒体头版头条内容精华摘要