ข้ามไปยังเนื้อหาหลัก

สำหรับชุมชนภาษา

สรุปสาระสำคัญ คู่มือสำหรับผู้พูดภาษาพื้นเมืองและภาษาที่มีทรัพยากรจำกัด อธิบายวิธีการมีส่วนร่วมกับ Arena (การแปลอ้างอิง การตรวจสอบการแปล และข้อมูลการฝึกสอน) รวมถึงสิ่งที่ชุมชนจะได้รับตอบแทน (ความเป็นเจ้าของโค้ด รายได้จาก API และการควบคุมการใช้งานอย่างเต็มรูปแบบ) ไม่จำเป็นต้องมีความรู้ด้านการเขียนโปรแกรม

คุณไม่จำเป็นต้องเป็นโปรแกรมเมอร์เพื่อมีส่วนร่วมกับ Arena หากคุณพูดภาษาพื้นเมืองหรือภาษาที่มีทรัพยากรจำกัด คุณคือบุคคลที่สำคัญที่สุดในระบบนิเวศนี้


สิ่งที่เราต้องการจากคุณ

การแปลอ้างอิง

เราต้องการคู่การแปลที่ผ่านการคัดสรรสำหรับการประเมินผล — ภาษาอังกฤษด้านหนึ่ง และภาษาของคุณอีกด้านหนึ่ง สิ่งเหล่านี้จะกลายเป็น "เฉลยคำตอบ" ที่ใช้ตัดสินคะแนนของวิธีการแปลทั้งหมด

คุณอาจสร้างสิ่งเหล่านี้จาก:

  • สื่อการศึกษา — แบบฝึกหัดในตำรา แผนการสอน ใบงาน
  • เอกสารชุมชน — รายงานการประชุม จดหมายข่าว ประกาศต่าง ๆ
  • วลีที่ใช้ในชีวิตประจำวัน — ข้อความใน UI ป้ายกำกับในแอป สำนวนที่ใช้บ่อย
  • เนื้อหาทางวัฒนธรรม — เรื่องเล่า บทเพลง หรือคำอธิบาย (โดยได้รับอนุญาตที่เหมาะสม)

รูปแบบเป็น JSON ที่เรียบง่าย:

{
"entries": [
{ "id": 1, "source": "Hello", "reference": "tânisi" },
{ "id": 2, "source": "Thank you", "reference": "kinanâskomitin" }
]
}

การตรวจสอบการแปล

ทุกวิธีการที่อ้างว่าสามารถผลิตการแปลที่ใช้งานได้จำเป็นต้องผ่านการตรวจสอบโดยมนุษย์ ผู้พูดสองภาษาจะตรวจสอบผลลัพธ์และบอกเราว่าคอมพิวเตอร์แปลถูกต้องหรือไม่ — และที่สำคัญกว่านั้นคือ เหตุใด จึงแปลผิดพลาด

ข้อมูลการฝึกสอน

กฎไวยากรณ์ รายการพจนานุกรม รูปแบบทางสัณฐานวิทยา — สิ่งเหล่านี้คือทรัพยากรทางภาษาศาสตร์ที่ทำให้วิธีการแปลทำงานได้ ความรู้ของคุณเกี่ยวกับการทำงานของภาษาของคุณนั้นไม่มีโมเดล AI ใดสามารถทดแทนได้


สิ่งที่คุณได้รับตอบแทน

ความเป็นเจ้าของ

เมื่อวิธีการแปลถูกสร้างขึ้นสำหรับภาษาของคุณและได้รับการตรวจสอบบน Arena แล้ว ความเป็นเจ้าของจะถูกโอน ไปยังองค์กรกำกับดูแลของชุมชนคุณ คุณเป็นเจ้าของโค้ด น้ำหนักโมเดล และการใช้งาน

รายได้

เมื่อนักพัฒนาใช้วิธีการแปลภาษาของคุณผ่าน champollion API ชุมชนของคุณจะได้รับ 90% ของรายได้จาก API ส่วนที่เหลืออีก 10% ครอบคลุมค่าใช้จ่ายด้านโครงสร้างพื้นฐาน

การควบคุม

องค์กรกำกับดูแลของคุณควบคุม:

  • ผู้ที่สามารถเข้าถึงวิธีการแปล
  • การอนุญาตให้ใช้งานในเชิงพาณิชย์หรือไม่
  • เงื่อนไขการกำหนดราคาที่ใช้บังคับ
  • เวลาและวิธีการอัปเดต
  • ข้อมูลที่ใช้สำหรับการพัฒนาต่อไป

วิธีการเข้าร่วม

  1. ติดต่อเรา — เปิด issue บน Arena repository หรือส่งอีเมลถึงผู้ดูแล
  2. อธิบายภาษาของคุณ — ภาษาของคุณอยู่ในตระกูลใด มีผู้พูดกี่คน ใช้ระบบการเขียนใดบ้าง มีทรัพยากรเชิงคำนวณอะไรบ้าง (FST พจนานุกรม คลังข้อมูล)
  3. เริ่มต้นจากสิ่งเล็กน้อย — แม้แต่คู่การแปลที่ผ่านการคัดสรรเพียง 50 คู่ก็เพียงพอที่จะสร้างชุดข้อมูลการประเมินและเปิดแทร็กลีดเดอร์บอร์ดใหม่
  4. เชื่อมต่อเรากับการกำกับดูแล — ใครในชุมชนของคุณมีอำนาจเหนือข้อมูลภาษาและเทคโนโลยี โมเดลอธิปไตยของ Arena ต้องการพันธมิตรด้านการกำกับดูแล

อธิปไตยของข้อมูล

ข้อมูลภาษาของคุณเป็นของคุณ Arena สร้างขึ้นบนหลักการ OCAP®:

  • เราไม่เก็บรวบรวมหรือจัดเก็บข้อมูลทางภาษาของคุณบนเซิร์ฟเวอร์ของเรา
  • วิธีการแปลใช้สถาปัตยกรรม api — ข้อมูลการฝึกสอน พจนานุกรม และกฎไวยากรณ์ทั้งหมดจะอยู่บนโครงสร้างพื้นฐานที่คุณควบคุม
  • คุณเป็นผู้ตัดสินใจว่าใครสามารถพัฒนาวิธีการแปลสำหรับภาษาของคุณ
  • คะแนนบนลีดเดอร์บอร์ดพิสูจน์ว่าวิธีการแปลทำงานได้ แต่ไม่ได้เป็นการอนุญาตให้นำไปใช้งาน

ดูเพิ่มเติม