世界上最强的AI——Qwen3,以参数量仅为DeepSeek - R1的三分之一,性能却超越众多全球顶尖模型,登顶全球最强开源模型,其具备混合推理模型、Agent能力,成本大幅降低,支持多语言,具有强大的生态和应用优势。
Qwen3由阿里巴巴于2025年4月29日凌晨5点发布,在奥数水平的AIME25测评中斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中突破70分大关,超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中以95.6分超越OpenAI - o1和DeepSeek - R1。它包含2个MoE和6个密集模型,从Qwen3 - 32B到Qwen3 - 0.6B,覆盖多种应用场景,且在Apache 2.0许可下开源,开发者和企业可免费使用。
Qwen3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型。对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。用户还能通过滑动“思考预算”按钮,控制思考的最大长度,匹配合适的推理质量和成本,灵活性高。
Qwen3正在迈向以训练Agent为中心的阶段,当前优化了Agent和代码能力,加强对MCP的支持,原生支持MCP协议,具备强大工具调用能力,结合Qwen - Agent框架,可降低编码复杂性,实现高效手机及电脑Agent操作等任务,能更好与实际应用场景结合。
在成本方面,Qwen3优势显著。它只需要4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一,部署成本仅为满血版DeepSeek - R1的25%至35%。其小型MoE模型Qwen3 - 30B - A3B的激活参数数量是QwQ - 32B的10%,表现却更胜一筹,像Qwen3 - 4B这样小模型也能匹敌Qwen2.5 - 72B - Instruct的性能,降低了开发者和企业的使用成本。
Qwen3的开源生态建设完善,阿里通义千问已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,超越Llama位居全球开源模型第一。它提供了丰富的工具链支持,与KTransformers等推理系统实现Day - 0支持,开源AMX高性能算子库,降低本地部署门槛。开发者可通过魔搭社区、HuggingFace等平台下载模型并商用,或通过阿里云百炼调用Qwen3的API服务。
Qwen3还具备强大的Agent能力,在BFCL评测中创下70.8的新高,超越Gemini2.5 - Pro、OpenAI - o1等顶尖模型。它与DeepSeek、Llama、OpenAI等竞争对手相比,更重视ToB服务生态,其多尺寸模型、混合推理能力和Agent能力能更好满足企业级用户需求。
Qwen3凭借卓越性能、灵活推理、强大Agent能力、成本优势和完善开源生态,为AI领域带来重大突破,未来有望在AI领域发挥更重要作用,值得持续关注。