تكنولوجيا وعلوم
أعلنت Xiaomi عن تحقيق نموذجها اللغوي MiMo-V2.5-Pro سرعة 1000 رمز في الثانية باستخدام وحدات معالجة سحابية عادية، متفوقةً على سرعة ChatGPT بحوالي 15 مرة.

أعلنت شركة Xiaomi عن تجاوز نموذجها اللغوي MiMo-V2.5-Pro سرعة معالجة 1000 رمز في الثانية عبر تفعيل وضع UltraSpeed الجديد، محققاً سرعة تقارب 15 ضعف سرعة ChatGPT، وذلك باستخدام وحدات معالجة رسومية سحابية عادية قابلة للتأجير بدلاً من شرائح مخصصة.
يُعد هذا الإنجاز مهماً لأن أي جهة لم تحقق هذه السرعة على نطاق تريليون المعاملات دون الاعتماد على أجهزة مخصصة. بالنسبة للمطورين الذين يبنون تطبيقات في الوقت الفعلي، فإن الفارق بين "السرعة الكافية" و"الفورية" يمثل الفرق بين أداة مفيدة وأخرى قد تسبب الإحباط.
كان النموذج السابق MiMo-V2-Flash قد أُطلق في ديسمبر 2025 بسرعة تقارب 150 رمزاً في الثانية، وهي سرعة تفوق سرعة القراءة البشرية. أما وضع UltraSpeed في MiMo-V2.5-Pro فيرفع هذه السرعة إلى 1000 رمز في الثانية بشكل مستمر، مع ذروة تصل إلى حوالي 1200 رمز في الثانية، وفقاً للإعلان الرسمي من Xiaomi MiMo. هذه السرعة تفوق سرعة النموذج السابق بمقدار 6.7 مرات، وتتقدم بشكل كبير على المعايير العامة الحالية، حيث يعمل GPT-5.5 بسرعة تقارب 68 رمزاً في الثانية، وClaude Opus عند 71، وGemini Flash عند 192.
تُستخدم ثلاث تقنيات مجتمعة لتحقيق هذا الأداء: التكميم الخبير FP4 (الذي يضغط عمليات النموذج دون التضحية بالدقة)، وفك التشفير التكهنى DFlash (الذي يتنبأ بعدة رموز مقدماً بشكل متوازي)، وتحسين وقت التشغيل TileRT، الذي تم تطويره بالتعاون مع شركة ناشئة متخصصة في الاستدلال تسمى TileRT. كلا من نقطة التحقق FP4-DFlash ووحدات TileRT مفتوحة المصدر على منصتي Hugging Face وGitHub على التوالي، مما يتيح للفرق استضافتها واختبارها بشكل مستقل.
يأتي تسريع UltraSpeed بتكلفة أعلى، حيث يُسعر بثلاثة أضعاف معدل MiMo-V2.5-Pro القياسي، أي حوالي 1.29 دولار لكل مليون رمز مدخل و2.61 دولار لكل مليون رمز مخرج. يتماشى هذا السعر مع الضغوط التي تفرضها شركة Groq، لكنه لا يتطلب شرائح مملوكة خاصة، حسبما أشارت PhoneWorld. الاستخدامات الواضحة لهذا الأداء تشمل كشف الاحتيال، والتداول الخوارزمي، والترجمة الفورية، وهي مجالات يكون فيها التأخير له تكلفة مالية مباشرة.
يُتاح الوصول إلى الخدمة خلال فترة التجربة الممتدة من 9 إلى 23 يونيو 2026، ويتم التحكم في الوصول عبر طلبات التطبيقات مع أولوية للعملاء المؤسساتيين والمطورين المحترفين الذين يمتلكون حالات استخدام محددة. يحصل المستخدمون المعتمدون على أسبوعين مجاناً، مع قيود يومية تشمل 10 طلبات في قائمة الانتظار لكل حساب، وحدود جلسة مدتها 30 دقيقة، وفصل تلقائي بعد 5 دقائق من الخمول. لا يدعم وضع UltraSpeed خطة الرموز Token Plan، ولم تُعلن Xiaomi عن تسعير API مخصص للولايات المتحدة أو المملكة المتحدة أو عن بنية تحتية إقليمية خارج فترة التجربة.
جميع أرقام السرعة مستمدة من اختبارات Xiaomi الداخلية، ولم يتم نشر أي تحقق مستقل من طرف ثالث حتى الآن. من المتوقع أن تتيح نقطة التحقق مفتوحة المصدر على Hugging Face إجراء اختبارات مجتمعية بسرعة. كما أن معدلات القبول تنخفض في المحادثات المفتوحة مقارنة بالمهام البرمجية، لذا يبقى أداء النموذج في بيئات الإنتاج الواقعية والتطبيقات العامة قيد التقييم.



