Alibaba Introduces Qwen3, Setting New Benchmark in Open-Source AI with Hybrid Reasoning
April 2025 - Alibaba has launched Qwen3, the latest generation of its open-sourced large language model (LLM) family, setting a new benchmark for AI innovation.
The Qwen3 series features six dense models and two Mixture-of-Experts (MoE) models, offering developers flexibility to build next-generation applications across mobile devices, smart glasses, autonomous vehicles, robotics and beyond.
All Qwen3 models – including dense models (0.6B, 1.7B, 4B, 8B, 14B, and 32B parameters) and MoE models (30B with 3B active, and 235B with 22B active) – are now open sourced and available globally.
Hybrid Reasoning Combining Thinking and Non-thinking Modes
Qwen3 marks Alibaba’s debut of hybrid reasoning models, combining traditional LLM capabilities with advanced, dynamic reasoning. Qwen3 models can seamlessly switch between thinking mode for complex, multi-step tasks such as mathematics, coding, and logical deduction and non-thinking mode for fast, general-purpose responses.
For developers accessing Qwen3 through API, the model offers granular control over thinking duration (up to 38K tokens), enabling an optimized balance between intelligent performance and compute efficiency. Notably, the Qwen3-235B-A22B MoE model significantly lowers deployment costs compared to other state-of-the-art models, reinforcing Alibaba’s commitment to accessible, high-performance AI.
Breakthroughs in Multilingual Skills, Agent Capabilities, Reasoning and Human Alignment
Trained on a massive dataset of 36 trillion tokens – double that of its predecessor Qwen2.5 -- Qwen3 delivers significant advancement on reasoning, instruction following, tool use and multilingual tasks.
Key capabilities include:
- Multilingual Mastery: Supports 119 languages and dialects, with leading performance in translation and multilingual instruction-following.
- Advanced Agent Integration: Natively supports the Model Context Protocol (MCP) and robust function-calling, leading open-source models in complex agent-based tasks.
- Superior Reasoning: Surpasses previous Qwen models (QwQ in thinking mode and Qwen2.5 in non-thinking mode) in mathematics, coding, and logical reasoning benchmarks.
- Enhanced Human Alignment: Delivers more natural creative writing, role-playing, and multi-turn dialogue experiences for more natural, engaging conversations.
Qwen3 models achieve top-tier results across industry benchmarks
Thanks to advancements in model architecture, increase in training data, and more effective training methods, Qwen3 models achieve top-tier results across industry benchmarks such as AIME25 (mathematical reasoning), LiveCodeBench (
Open Access to Drive Innovation
Qwen3 models are now freely available for download on Hugging Face, Github, and ModelScope, and can be explored on chat.qwen.ai. API access will soon be available through Alibaba’s AI model development platform Model Studio. Qwen3 also powers Alibaba’s flagship AI super assistant application, Quark.
Since its debut, the Qwen model family has attracted over 300 million downloads worldwide. Developers have created more than 100,000 Qwen-based derivative models on Hugging Face, making Qwen one of the world’s most widely adopted open-source AI model series.
"علي بابا" تطلق Qwen3، وترسي معياراً جديداً في الذكاء الاصطناعي مفتوح المصدر المتميز بالمنطق الهجين
أبريل 2025: أطلقت علي بابا Qwen3، أحدث جيل من مجموعة نماذج اللغة الضخمة مفتوحة المصدر، لترسي بذلك معياراً جديداً للابتكار ضمن مجال الذكاء الاصطناعي.
وتتميز سلسلة Qwen3 بستة نماذج كثيفة ونموذجين قائمين على مزيج الخبراء، ما يوفر للمطورين المرونة اللازمة لإنشاء تطبيقات الجيل المقبل عبر مجالات الأجهزة المحمولة، والنظارات الذكية، والمركبات ذاتية القيادة، والروبوتات وغيرها الكثير.
وأصبحت كل نماذج Qwen3 مفتوحة المصدر ومتاحة عالمياً، بما فيها النماذج الكثيفة بمحددات 0.6 مليار، و1.7 مليار، و4 مليارات، و8 مليارات، و14 ملياراً، و32 ملياراً ونماذج مزيج الخبراء بمحددات 30 ملياراً مع 3 مليارات نشطة، و235 ملياراً مع 22 ملياراً نشطة.
منطق هجين يجمع بين وضعي التفكير وعدم التفكير
تمثل مجموعة Qwen3 أول ظهور لنماذج المنطق الهجين من علي بابا، التي تجمع بين قدرات نماذج اللغة الضخمة التقليدية والتفكير المنطقي المتقدم والديناميكي. يمكن لنماذج Qwen3 التنقل بسلاسة بين وضع التفكير للمهام المعقدة متعددة الخطوات، مثل الرياضيات والبرمجة والاستنتاج المنطقي، ووضع عدم التفكير للاستجابات السريعة متعددة الأغراض.
أما بالنسبة للمطورين الذين يصلون إلى Qwen3 عبر واجهة برمجة التطبيقات، فيوفر النموذج تحكماً دقيقاً في مدة التفكير حتى 38 ألف رمز، ما يتيح توازناً محسّناً بين الأداء الذكي وكفاءة الحوسبة. وتجدر الإشارة إلى أن نموذج Qwen3-235B-A22B القائم على مزيج الخبراء يقلص تكاليف النشر إلى حد بعيد مقارنة بالنماذج الأخرى المتطورة، ما يرسّخ التزام علي بابا بتوفير ذكاء اصطناعي عالي الأداء ومتاح.
ابتكارات في المهارات متعددة اللغات، وقدرات الوكلاء، والمنطق، والمواءمة البشرية
جرى تدريب Qwen3 على مجموعة بيانات ضخمة تتكون من 36 تريليون رمز، أي ضعف ما تدرّب عليه سلفه Qwen2.5، ما يحقق تقدماً هائلاً في المنطق، وقدرات اتباع التعليمات، واستخدام الأدوات، والمهام متعددة اللغات.
وتشمل أهم القدرات:
- إتقان لغات عديدة: يدعم 119 لغة ولهجة، بأداء رائد في الترجمة واتباع التعليمات بلغات متعددة.
- تكامل متقدم للوكلاء: يدعم بطبيعته بروتوكول سياق النموذج واستدعاء متين للوظائف، متصدراً النماذج مفتوحة المصدر في المهام المعقدة القائمة على الوكلاء.
- منطق فائق: يتفوق على نماذج Qwen السابقة، QwQ في وضع التفكير وQwen2.5 في وضع عدم التفكير، ضمن مقاييس الرياضيات والبرمجة والمنطق.
- تعزيز المواءمة البشرية: يقدم تجارب أكثر طبيعية في الكتابة الإبداعية، وتأدية الأدوار، والحوار متعدد الجولات لمحادثات أكثر طبيعية وتفاعلية.
نماذج Qwen3 تحقق نتائج متفوقة عبر مختلف معايير القطاع
وبفضل تقدم بنية النماذج، وزيادة بيانات التدريب، وأساليب التدريب الأكثر فعالية، تحقق نماذج Qwen3 نتائج متفوقة عبر المعايير المعتمدة في القطاع، ومنها AIME25 للتفكير الرياضي، وLiveCodeBench لكفاءة البرمجة، وBFCL لقدرات استخدام الأدوات واستدعاء الوظائف، وArena-Hard كمعيار لنماذج اللغة الضخمة المدربة على التعليمات. كما جرى تنفيذ عملية تدريب من أربع مراحل لتطوير نموذج المنطق الهجين، شملت البداية الصعبة لسلسلة التفكير الطويلة، والتعلم المعزز القائم على المنطق، ودمج وضع التفكير، والتعلم المعزز العام.
الوصول المفتوح لدفع الابتكار
أصبحت نماذج Qwen3 متاحة الآن للتنزيل مجاناً عبر منصات Hugging Face، وGithub، وModelScope، ويمكن استكشافها عبر chat.qwen.ai. سيتوفر قريباً الوصول إلى واجهة برمجة التطبيقات عن طريق منصة تطوير نماذج الذكاء الاصطناعي من علي بابا "موديل استوديو". كما يدعم Qwen3 تطبيق Quark، مساعد الذكاء الاصطناعي الخارق الرائد من علي بابا.
واستقطبت مجموعة نماذج Qwen منذ إطلاقها ما يفوق 300 مليون تنزيل حول العالم. وأنشأ المطورون أكثر من 100 ألف نموذج مشتق من Qwen عبر منصة Hugging Face، ما يجعل Qwen إحدى سلاسل نماذج الذكاء الاصطناعي مفتوحة المصدر الأكثر اعتماداً حول العالم.
انتهى