メインコンテンツへスキップ

MT Eval Arena

Think you can solve it? Prove it.

低リソース機械翻訳のための独立ベンチマーク — 48の開発コーパス、19指標のスコアリングインベントリ、ブートストラップ信頼区間、そして商用サービスが対応しない言語向けのFST形態論的検証を提供します。

ドキュメントを読む GitHubで見る

MT Eval Arena は Champollion プロジェクトの評価エンジンです。

📐

標準化されたベンチマーク

chrF++、完全一致、FST受理、意味的スコアリング、ブートストラップ信頼区間による再現可能な評価。すべての実行にフィンガープリントが付与されます。

🏴

コミュニティの主権

優れた手法の所有権は言語コミュニティに移転されます。OCAP®原則に基づき、コミュニティがデータ・手法・収益を管理します。

🔌

オープンプラグインアーキテクチャ

coached LLM、ファインチューニング済みモデル、FST-gatedパイプライン、カスタムプラグインなど、あらゆる手法を持ち込めます。翻訳を出力できるものであれば、ハーネスがスコアリングします。

🚀

デプロイメントブリッジ

実証済みの手法はchampollionを通じて本番環境にデプロイされます。開発者はAPIで利用でき、収益はコミュニティに還元されます。

現在のベンチマーク

EDTeKLA Dev Set v1

言語： 英語 → 平原クリー語（SRO）
エントリー数： 486件以上のキュレーション済みペア
ライセンス： CC BY-NC-SA 4.0
ソース： University of Alberta

FLORES+ Devtest

言語： 英語 → 39言語
エントリー数： 言語ごとに1,012文
ライセンス： CC BY-SA 4.0
出典： OLDI / HuggingFace

詳細を見る

手法を登録する →データ主権 →経済モデル →言語コミュニティ向け →リーダーボード →champollion CLI →