The MT Eval Arena | MT Eval Arena

📐

Gestandaardiseerde benchmarks

Reproduceerbare evaluatie met chrF++, exacte overeenkomst, FST-acceptatie, semantische scoring en bootstrap-betrouwbaarheidsintervallen. Elke uitvoering wordt voorzien van een vingerafdruk.

🏴

Gemeenschapszeggenschap

Winnende methoden dragen het eigendom over aan de taalgemeenschap. OCAP®-principes. Gemeenschappen beheren hun gegevens, hun methoden en hun inkomsten.

🔌

Open plugin-architectuur

Gebruik elke methode: een begeleid LLM, een fijnafgestemd model, een FST-gestuurde pipeline of een aangepaste plugin. Als het vertalingen produceert, kan het harness het scoren.

🚀

Deployment Bridge

Bewezen methoden worden via champollion in productie genomen. Ontwikkelaars gebruiken de API. Inkomsten vloeien terug naar de gemeenschap.

Huidige benchmarks

EDTeKLA Dev Set v1

Taal: Engels → Plains Cree (SRO)
Vermeldingen: 486+ gecureerde paren
Licentie: CC BY-NC-SA 4.0
Bron: University of Alberta

FLORES+ Devtest

Talen: Engels → 39 talen
Vermeldingen: 1.012 zinnen per taal
Licentie: CC BY-SA 4.0
Bron: OLDI / HuggingFace

Meer informatie

Methode indienen →Datasoevereiniteit →Economisch model →Voor taalgemeenschappen →Leaderboard →champollion CLI →