الانتقال إلى المحتوى الرئيسي

MT Eval Arena

Think you can solve it? Prove it.

المعيار المرجعي المستقل للترجمة الآلية للغات منخفضة الموارد — 48 مدونة تطوير، ومجموعة من 19 مقياسًا للتقييم، وفترات ثقة بطريقة bootstrap، وتحقق صرفي باستخدام FST للغات التي لن تدعمها الخدمات التجارية أبدًا.

MT Eval Arena هو محرك التقييم لمشروع Champollion.

📐

معايير قياسية موحدة

تقييم قابل لإعادة الإنتاج باستخدام chrF++ والمطابقة التامة وقبول FST والتقييم الدلالي وفترات الثقة بطريقة bootstrap. كل عملية تشغيل تحمل بصمة فريدة.

🏴

سيادة المجتمع

تنتقل ملكية الأساليب الفائزة إلى مجتمع اللغة. مبادئ OCAP®. تتحكم المجتمعات في بياناتها وأساليبها وعائداتها.

🔌

بنية إضافات مفتوحة

أحضر أي أسلوب: نموذج LLM موجَّه، أو نموذج مضبوط بدقة، أو خط معالجة محكوم بـ FST، أو إضافة مخصصة. إذا كان ينتج ترجمات، فيمكن لمنصة التقييم تقييمه.

🚀

جسر النشر

تُنشر الأساليب المُثبتة في بيئة الإنتاج عبر champollion. ويستخدمها المطورون عبر API. وتعود العائدات إلى المجتمع.

المعايير الحالية

EDTeKLA Dev Set v1

  • اللغة: الإنجليزية ← Plains Cree (SRO)
  • المدخلات: أكثر من 486 زوجًا منتقى
  • الترخيص: CC BY-NC-SA 4.0
  • المصدر: University of Alberta

FLORES+ Devtest

  • اللغات: الإنجليزية ← 39 لغة
  • الإدخالات: 1,012 جملة لكل لغة
  • الترخيص: CC BY-SA 4.0
  • المصدر: OLDI / HuggingFace