阿里开源Qwen3引爆AI圈,马斯克急发Grok 3.5应战,全球大模型大战一触即发

2025年4月29日,中国的巨头阿里巴巴发布并开源了新一代通义千问Qwen3大模型。此次新模型的性能表现如何?

据公开资料显示,Qwen3模型的前身Qwen1.5-110B模型在多个基准测试中表现优异,与Meta的Llama3-70B模型相媲美。

而本次更新的Qwen3引入了混合推理机制,它结合传统语言模型的生成能力与动态推理能力,提升了模型在复杂任务中的表现,尤其适用于需要逻辑推理和多步骤推导的场景。本次多个评测表明,Qwen3在包括编码、数学和通用能力等多个基准测试中,超越了DeepSeek-R1、OpenAI-o1等顶尖模型,俨然成为目前最强的开源大语言模型之一。   

那么阿里巴巴本次发布的Qwen3有哪些让人期待的亮点呢?

  1. 多语言支持与跨平台兼容: 本次的Qwen3除了对中文、英文的支持,还包括德语、日语、法语等。累计超过了29种语言。这表明跨语言应用能力进一步提升,而且Qwen3具有良好的跨平台兼容性,方便在不同操作系统和硬件环境中部署。

  2. 混合推理能力: Qwen3引入了“思考模式”和“非思考模式”。它结合传统语言模型的生成能力与动态推理能力,提升了模型在复杂任务中的表现,尤其适用于需要逻辑推理和多步骤推导的场景。   

  3. 开源的力量: 本次阿里巴巴将Qwen3全系列模型(包括旗舰模型)都进行了开源,遵循Apache 2.0许可证开源。这对于推动AI技术的普及和发展具有重要意义。
  4. 高性价比: Qwen3在实现顶尖性能的同时,显著降低了部署成本。以旗舰模型Qwen3-235B-A22B举例,仅需4张H20即可部署,而性能相近的DeepSeek-R1需要8张甚至更多。而且本次华为计算方面表示,此前昇腾MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。

  5. 阿里巴巴发布Qwen3后,特斯拉创始人马斯克随后在X平台发布了消息:Next week, Grok 3.5 early beta release to SuperGrok subscribers only. It is the first AI that can, for example, accurately answer technical questions about rocket engines or electrochemistry.

 

那么Grok 3.5将会带来什么样的惊喜呢?

巧合的是,也就是今天,Meta举办了首届“LlamaCon”大会。这也是Meta举行的首届AI开发者大会。旨在进一步推广其开源Llama模型,吸引更多开发者参与到开源AI的生态建设中,并共同推动生成式人工智能技术发展。

依然是今天,用户数亿学习用户的Duolingo宣布转型为“AI优先”公司。这家公司积极拥抱AI,将广泛采用AI技术,包括在招聘、绩效评估和人员配置等方面,以提高运营效率。

人工智能在全球范围内的广泛影响力越来越大,无论是巨头还是明星企业,都不愿错过这趟东风,那谁会是最终的赢家呢?

 

创作不易,更多关于AI的好文章,请关注:https://iaiseek.com/news

作者: IAISEEK AI Editorial Team创作时间: 2025-04-29 16:17:10
阅读更多