MT Eval Arena

📐

Benchmarks Padronizados

Avaliação reproduzível com chrF++, correspondência exata, aceitação FST, scoring semântico e intervalos de confiança bootstrap. Cada execução é impressa digitalmente.

🏴

Soberania Comunitária

Métodos vencedores transferem propriedade para a comunidade de idioma. Princípios OCAP®. Comunidades controlam seus dados, seus métodos e sua receita.

🔌

Arquitetura de Plugin Aberta

Traga qualquer método: LLM treinado, modelo fine-tuned, pipeline com gate FST ou plugin customizado. Se produz traduções, o harness consegue avaliar.

🚀

Ponte de Implantação

Métodos comprovados são implantados em produção via champollion. Desenvolvedores consomem via API. Receita retorna para a comunidade.

Benchmarks Atuais

EDTeKLA Dev Set v1

Idioma: English → Plains Cree (SRO)
Entradas: 486+ pares curados
Licença: CC BY-NC-SA 4.0
Fonte: University of Alberta

FLORES+ Devtest

Idiomas: Inglês → 39 idiomas
Entradas: 1.012 sentenças por idioma
Licença: CC BY-SA 4.0
Fonte: OLDI / HuggingFace

Saiba Mais

Enviar um Método →Soberania de Dados →Modelo Econômico →Para Comunidades Linguísticas →Ranking →champollion CLI →