Dubai, United Arab Emirates, 13 April 2025 — SambaNova, the generative AI company delivering the most efficient AI chips and fastest models, today announced the availability of Meta's Llama 4 Maverick model on SambaNova Cloud — setting a new industry benchmark delivering 655 tokens per second inference speed. The performance, verified by independent evaluator Artificial Analysis, makes SambaNova the fastest platform for Llama 4 Maverick inference.
"Artificial Analysis has independently benchmarked SambaNova’s cloud deployment of Meta's Llama 4 Maverick model (400B total parameters, 17B active parameters) at 655 output tokens/s. This is the fastest output speed we have measured yet for Llama 4 Maverick, and it is several times faster than the fastest speeds achieved so far on GPUs. Llama 4 Maverick is Meta's strongest model yet and a top choice for a wide range of workloads," said Micah Hill-Smith, CEO & Co-Founder of Artificial Analysis.
Llama 4 Maverick, Meta’s flagship multimodal model featuring 400 billion total parameters/17 billion active parameters and 128 experts, outperforms industry competitors such as GPT-4o and Gemini 2.0 Flash in multilingual and visual understanding benchmarks. Utilizing SambaNova’s advanced Reconfigurable Dataflow Unit (RDU) chips, Maverick on SambaNova Cloud delivers industry-leading performance with unparalleled computational efficiency.
"We’re thrilled to partner with Meta, bringing the fastest inference speeds ever recorded for Llama 4 Maverick to developers and enterprises," stated Rodrigo Liang, CEO and co-founder of SambaNova. "This collaboration marks a significant leap forward in the efficiency and capability of multimodal AI models."
This week, SambaNova will deliver multimodal capabilities and longer context lengths with Meta's Llama 4 Maverick, enabling developers with image recognition and agentic capabilities.
SambaNova Cloud now offers Llama 4 Maverick at an attractive, cost-effective rate of $0.50 per million input tokens and $2.00 per million output tokens, making powerful multimodal AI accessible at scale.
Explore the power of Llama 4 Maverick today on SambaNova Cloud at cloud.sambanova.ai.
سامبا نوفا تحطّم الرقم القياسي في سرعة الاستدلال بالذكاء الاصطناعي وَفق نموذج ميتا الجديد (لاما 4 مافريك)
دبي، الإمارات العربية المتحدة، 13 أبريل 2025: أعلنت اليوم سامبا نوفا، الشركة المتخصصة في حلول الذكاء الاصطناعي التوليدي والتي تطور النماذج الأسرع والرقائق الأكثر تقدماً في هذا المجال، عن توفر نموذج ميتا الجديد "لاما 4 مافريك" (Llama 4 Maverick) على منصة سامبا نوفا كلاود، مع سرعة استدلال فائقة تبلغ 655 رمزاً في الثانية، وقد تم التحقق من الأداء من قِبل مؤسسة تحليلات الذكاء الاصطناعي المستقلة (Artificial Analysis)، مما يجعل منصة سامبا نوفا الأسرع في العالم في عمليات الاستدلال الخاصة بالذكاء الاصطناعي وفقاً لنموذج ميتا الجديد.
وبهذه المناسبة، قال ميكا هيل-سميث، الرئيس التنفيذي والمؤسس المشارك لمؤسسة تحليلات الذكاء الاصطناعي المستقلة (Artificial Analysis): "لقد قمنا في شركة (Artificial Analysis) بتقييم أداء نموذج ميتا الجديد "لاما 4 مافريك" (والذي يحتوي على 400 مليار مُعامل منها 17 مليار مُعامل نشط) على منصة سامبا نوفا كلاود، وبلغت سرعة الإنتاج 655 رمزاً في الثانية، وهذه هي أكبر سرعة لنموذج "لاما 4 مافريك" حتى الآن، وهي أكبر بعدة مرات من أعلى السرعات التي تم تحقيقها باستخدام وحدات معالجة الرسوميات. ويعدّ نموذج "لاما 4 مافريك" أقوى نموذج أصدرته شركة ميتا حتى الآن، ويُعد خياراً مثالياً لمجموعة واسعة من حالات الاستخدام".
ويتفوق نموذج ميتا الجديد "لاما 4 مافريك" على النماذج المنافسة مثل GPT-4o و Gemini 2.0 Flash في اختبارات استيعاب اللغات المتعددة والرسومات، لاسيما وأنه يضم 400 مليار مُعامل منها 17 مليار مُعامل نشط و128 من الخبراء المتخصصين. وفي المقابل، تتيح رقائق (RDU) التي تطورها شركة سامبا نوفا، تشغيل نموذج مافريك على منصة سامبا نوفا كلاود لتوفر أداءً لا يضاهى وكفاءة لا مثيل لها في الحوسبة.
من جانبه، قال رودريغو ليانغ، الرئيس التنفيذي والمؤسس المشارك لشركة سامبا نوفا: "إننا متحمسون للتعاون مع شركة ميتا وتقديم أكبر سرعات استدلال تم تسجيلها على الإطلاق وفق نموذج "لاما 4 مافريك" للمطورين والمؤسسات. إذ يمثل هذا التعاون قفزة كبيرة إلى الأمام في كفاءة وقدرات نماذج الذكاء الاصطناعي متعددة الوسائط."
وخلال هذا الأسبوع، ستقدم سامبا نوفا قدرات متعددة الوسائط وسياقات أطول باستخدام نموذج "لاما 4 مافريك" من شركة ميتا، مما يمكّن المطورين من استخدام إمكانيات التعرف على الصور ويزودهم بقدرات الذكاء الاصطناعي الوكيل.
توفر شركة سامبا نوفا إمكانية الوصول إلى نموذج "لاما 4 مافريك" بأسعار تنافسية تبلغ 0.50 دولاراً لكل مليون رمز إدخال، و 2 دولار لكل مليون رمز إخراج، مما يجعل الذكاء الاصطناعي القوي ومتعدد الوسائط متاحاً على نطاق واسع.
ويمكن استكشاف قوة نموذج "لاما 4 مافريك" على منصة سامبا نوفا كلاود عبر الموقع: cloud.sambanova.ai.