The MT Eval Arena | MT Eval Arena

📐

Benchmarks standardisés

Évaluation reproductible avec chrF++, correspondance exacte, acceptation FST, scoring sémantique, et intervalles de confiance par bootstrap. Chaque exécution est empreinte numérique.

🏴

Souveraineté communautaire

Les méthodes gagnantes transfèrent la propriété à la communauté linguistique. Principes OCAP®. Les communautés contrôlent leurs données, leurs méthodes et leurs revenus.

🔌

Architecture de plugin ouverte

Apportez n'importe quelle méthode : LLM entraîné, modèle affiné, pipeline contrôlé par FST, ou plugin personnalisé. Si elle produit des traductions, le système peut la scorer.

🚀

Pont de déploiement

Les méthodes éprouvées se déploient en production via champollion. Les développeur·se·s consomment via API. Les revenus reviennent à la communauté.

Benchmarks actuels

EDTeKLA Dev Set v1

Langue : Anglais → Cri des Plaines (SRO)
Entrées : 486+ paires curées
Licence : CC BY-NC-SA 4.0
Source : Université de l'Alberta

FLORES+ Devtest

Langues : Anglais → 39 langues
Entrées : 1 012 phrases par langue
Licence : CC BY-SA 4.0
Source : OLDI / HuggingFace

En savoir plus

Soumettre une méthode →Souveraineté des données →Modèle économique →Pour les communautés linguistiques →Classement →champollion CLI →