Ir para o conteúdo principal

MT Eval Arena

Think you can solve it? Prove it.

O benchmark independente para tradução automática de baixo recurso — 48 corpora de desenvolvimento, um inventário de 19 métricas, intervalos de confiança bootstrap e validação morfológica FST para idiomas que serviços comerciais nunca suportarão.

MT Eval Arena é o mecanismo de avaliação do projeto Champollion.

📐

Benchmarks Padronizados

Avaliação reproduzível com chrF++, correspondência exata, aceitação FST, scoring semântico e intervalos de confiança bootstrap. Cada execução é impressa digitalmente.

🏴

Soberania Comunitária

Métodos vencedores transferem propriedade para a comunidade de idioma. Princípios OCAP®. Comunidades controlam seus dados, seus métodos e sua receita.

🔌

Arquitetura de Plugin Aberta

Traga qualquer método: LLM treinado, modelo fine-tuned, pipeline com gate FST ou plugin customizado. Se produz traduções, o harness consegue avaliar.

🚀

Ponte de Implantação

Métodos comprovados são implantados em produção via champollion. Desenvolvedores consomem via API. Receita retorna para a comunidade.

Benchmarks Atuais

EDTeKLA Dev Set v1

  • Idioma: English → Plains Cree (SRO)
  • Entradas: 486+ pares curados
  • Licença: CC BY-NC-SA 4.0
  • Fonte: University of Alberta

FLORES+ Devtest

  • Idiomas: Inglês → 39 idiomas
  • Entradas: 1.012 sentenças por idioma
  • Licença: CC BY-SA 4.0
  • Fonte: OLDI / HuggingFace