Gestandaardiseerde benchmarks
Reproduceerbare evaluatie met chrF++, exacte overeenkomst, FST-acceptatie, semantische scoring en bootstrap-betrouwbaarheidsintervallen. Elke uitvoering wordt voorzien van een vingerafdruk.
Gemeenschapszeggenschap
Winnende methoden dragen het eigendom over aan de taalgemeenschap. OCAP®-principes. Gemeenschappen beheren hun gegevens, hun methoden en hun inkomsten.
Open plugin-architectuur
Gebruik elke methode: een begeleid LLM, een fijnafgestemd model, een FST-gestuurde pipeline of een aangepaste plugin. Als het vertalingen produceert, kan het harness het scoren.
Deployment Bridge
Bewezen methoden worden via champollion in productie genomen. Ontwikkelaars gebruiken de API. Inkomsten vloeien terug naar de gemeenschap.
Huidige benchmarks
EDTeKLA Dev Set v1
- Taal: Engels → Plains Cree (SRO)
- Vermeldingen: 486+ gecureerde paren
- Licentie: CC BY-NC-SA 4.0
- Bron: University of Alberta
FLORES+ Devtest
- Talen: Engels → 39 talen
- Vermeldingen: 1.012 zinnen per taal
- Licentie: CC BY-SA 4.0
- Bron: OLDI / HuggingFace