所有権の移転
要旨。 翻訳手法が Deployable ティア(composite スコア ≥ 0.70)に到達し、コミュニティレビューを通過した時点で、コードの所有権は研究者から先住民族のガバナンス組織へ移転されます。このページでは、5段階の移転パイプライン、OCAP® との整合性、および先住民族言語向けの手法を開発する研究者へのガイダンスを説明します。
翻訳手法が Arena のリーダーボードで上位に入ったとき、そのコードはどうなるのでしょうか?先住民族言語や低リソース言語においては、「研究者が保持する」という答えにはなりません。答えは、コミュニティが所有する、です。
仕組み
Arena は、研究からコミュニティ所有権への明確なパイプラインを実施しています。
1. 手法の開発
研究者、学生、または開発者が翻訳手法を構築します。FST ゲート付きパイプライン、coached LLM、ファインチューニング済みモデル、その他あらゆるアプローチが対象です。開発は各自のリソースを使って行われます。
2. Arena による評価
手法は eval harness を通じてベンチマーク評価されます。すべての提出物は特定の Git コミットとデータセットバージョンにフィンガープリントされます。スコアは再現可能です。
3. コミュニティレビュー
先住民族言語の手法については、コミュニティの言語担当者およびガバナンス組織が結果をレビューします。リーダーボードの高スコアは手法が機能することを証明しますが、それが適切であることを証明するものではありません。
4. コードの移転
手法がゴールドスタンダード評価に対して Deployable ティア(composite スコア ≥ 0.70)を達成し、かつコミュニティレビュー(人手による検証)を通過した場合:
- 研究者はソースコードを引き渡します
- 法的所有権が先住民族のガバナンス組織(部族評議会、言語機関、Métis 組織など)へ移転されます
- ガバナンス組織が評価データセットの暗号化キーを保持します
- 手法はコミュニティが管理する資産となります
品質ティアの定義については Scoring Specification の §5 を、移転条件の全文については Benchmark Specification の §8.3 を、人手による検証ゲートについては §7 をご参照ください。
5. 本番環境へのデプロイ
手法は champollion プラグインとしてエクスポートされ、本番 API にデプロイされます。コミュニティは以下を管理します:
- 手法へのアクセスを許可する対象
- 適用する料金体系
- 手法を商業利用できるかどうか
- 手法の更新時期と方法
なぜこれが重要なのか
従来の機械学習研究は搾取的なパターンに従っています:
- 研究者がコミュニティからデータを収集する
- 研究者がモデルを訓練する
- 研究者が論文を発表する
- コミュニティは何も受け取らない
このパターンは現在、産業規模で機能しています。Meta の OMT-1600(2026年3月)は、Plains Cree などの先住民族言語を含む1,600言語の翻訳モデルを、ウェブスクレイピングデータと聖書翻訳を使って訓練しました。モデルはコミュニティの同意プロトコルなしに訓練され、重みは現在ダウンロード可能な状態にはなく、言語をモデル化されたコミュニティには所有権も、ガバナンスの役割も、収益も与えられていません。論文が成果物であり、コミュニティはデータソースに過ぎません。
Arena はこれを逆転させます:
- 研究者が手法を構築する
- Arena がコミュニティによってキュレーションされたコーパスと形態論的メトリクスを用いて手法を検証する
- コミュニティが動作するコードの所有権を受け取る
- コミュニティが API 利用から収益を得る
これが Champollion と OMT-1600 を含む他のすべての LRL MT の取り組みとの根本的な違いです: 私たちはコミュニティのために手法を生み出すだけでなく、手法の所有権をコミュニティへ移転します。コード、重み、デプロイインフラ——これらすべてがコミュニティの財産となります。これは理論的な枠組みではなく、プラットフォーム上のすべての先住民族言語手法に対する実際の運用パイプラインです。
OCAP® との整合性
所有権移転プロセスは、OCAP® 原則を直接実装しています:
| 原則 | 実装内容 |
|---|---|
| Ownership(所有) | ガバナンス組織が手法コードおよびモデル重みの権原を保持する |
| Control(管理) | ガバナンス組織がデプロイ条件、アクセス、および料金体系を管理する |
| Access(アクセス) | コミュニティメンバーは champollion API または直接ダウンロードを通じて手法にアクセスする |
| Possession(保持) | 言語リソース(coaching データ、辞書、FST ルール)は api 手法を通じてコミュニティが管理するインフラ上に保持される |
研究者の方へ
先住民族言語向けの手法を開発している場合:
- 関係を構築する — 開始前に言語コミュニティとの関係を確立してください
- オープンライセンスのデータを使用する — 開発にはコミュニティが制限しているリソースではなく、オープンライセンスのデータを使用してください
- 出所を文書化する — run card にすべてのリソース、そのライセンス、および出所を記載してください
- 移転の準備をする — 手法が成功した場合、コードはコミュニティのものであり、あなたのものではありません
- これは制限ではなく、機能です — あなたの貢献はアーキテクチャと技術であり、それは発表・再利用できます。コミュニティの貢献は、その言語で機能させる言語知識です。
関連情報
- データ主権 — OCAP、CARE、および Te Mana Raraunga の原則
- 経済モデル — 所有権が収益につながる仕組み
- 低リソース言語を支援する — 研究の背景