معايير قياسية موحدة
تقييم قابل لإعادة الإنتاج باستخدام chrF++ والمطابقة التامة وقبول FST والتقييم الدلالي وفترات الثقة بطريقة bootstrap. كل عملية تشغيل تحمل بصمة فريدة.
سيادة المجتمع
تنتقل ملكية الأساليب الفائزة إلى مجتمع اللغة. مبادئ OCAP®. تتحكم المجتمعات في بياناتها وأساليبها وعائداتها.
بنية إضافات مفتوحة
أحضر أي أسلوب: نموذج LLM موجَّه، أو نموذج مضبوط بدقة، أو خط معالجة محكوم بـ FST، أو إضافة مخصصة. إذا كان ينتج ترجمات، فيمكن لمنصة التقييم تقييمه.
جسر النشر
تُنشر الأساليب المُثبتة في بيئة الإنتاج عبر champollion. ويستخدمها المطورون عبر API. وتعود العائدات إلى المجتمع.
المعايير الحالية
EDTeKLA Dev Set v1
- اللغة: الإنجليزية ← Plains Cree (SRO)
- المدخلات: أكثر من 486 زوجًا منتقى
- الترخيص: CC BY-NC-SA 4.0
- المصدر: University of Alberta
FLORES+ Devtest
- اللغات: الإنجليزية ← 39 لغة
- الإدخالات: 1,012 جملة لكل لغة
- الترخيص: CC BY-SA 4.0
- المصدر: OLDI / HuggingFace