Naar hoofdinhoud gaan

MT Eval Arena

Think you can solve it? Prove it.

De onafhankelijke benchmark voor machine-vertaling van laagbeschikbare talen — 48 ontwikkelcorpora, een scoringsinventaris van 19 metrieken, bootstrap-betrouwbaarheidsintervallen en FST-morfologische validatie voor talen die commerciële diensten nooit zullen ondersteunen.

MT Eval Arena is de evaluatie-engine van het Champollion-project.

📐

Gestandaardiseerde benchmarks

Reproduceerbare evaluatie met chrF++, exacte overeenkomst, FST-acceptatie, semantische scoring en bootstrap-betrouwbaarheidsintervallen. Elke uitvoering wordt voorzien van een vingerafdruk.

🏴

Gemeenschapszeggenschap

Winnende methoden dragen het eigendom over aan de taalgemeenschap. OCAP®-principes. Gemeenschappen beheren hun gegevens, hun methoden en hun inkomsten.

🔌

Open plugin-architectuur

Gebruik elke methode: een begeleid LLM, een fijnafgestemd model, een FST-gestuurde pipeline of een aangepaste plugin. Als het vertalingen produceert, kan het harness het scoren.

🚀

Deployment Bridge

Bewezen methoden worden via champollion in productie genomen. Ontwikkelaars gebruiken de API. Inkomsten vloeien terug naar de gemeenschap.

Huidige benchmarks

EDTeKLA Dev Set v1

  • Taal: Engels → Plains Cree (SRO)
  • Vermeldingen: 486+ gecureerde paren
  • Licentie: CC BY-NC-SA 4.0
  • Bron: University of Alberta

FLORES+ Devtest

  • Talen: Engels → 39 talen
  • Vermeldingen: 1.012 zinnen per taal
  • Licentie: CC BY-SA 4.0
  • Bron: OLDI / HuggingFace