分享缩略图
华为昇腾连夜适配千问3
来源:IT之家 2025-05-06 07:07:40
大字

在阿里通义千问模型Qwen3(简称千问3)模型开源数小时后,华为官方宣布昇腾支持千问3全系列模型部署,开发者在MindSpeed和MindIE中开箱即用,实现千问3的0Day适配。

据悉,千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。华为官方表示,千问3的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。

此前华为昇腾就一直同步支持千问系列模型。昇腾MindSpeed训练、MindIE推理支持千问2.5、兼容主流生态的分布式并行接口等,千问3系列模型一发布即实现低代码无缝迁移。

分享到
037165901996 回顶部