สำหรับชุมชนภาษา
สรุปสาระสำคัญ คู่มือสำหรับผู้พูดภาษาพื้นเมืองและภาษาที่มีทรัพยากรจำกัด อธิบายวิธีการมีส่วนร่วมกับ Arena (การแปลอ้างอิง การตรวจสอบการแปล และข้อมูลการฝึกสอน) รวมถึงสิ่งที่ชุมชนจะได้รับตอบแทน (ความเป็นเจ้าของโค้ด รายได้จาก API และการควบคุมการใช้งานอย่างเต็มรูปแบบ) ไม่จำเป็นต้องมีความรู้ด้านการเขียนโปรแกรม
คุณไม่จำเป็นต้องเป็นโปรแกรมเมอร์เพื่อมีส่วนร่วมกับ Arena หากคุณพูดภาษาพื้นเมืองหรือภาษาที่มีทรัพยากรจำกัด คุณคือบุคคลที่สำคัญที่สุดในระบบนิเวศนี้
สิ่งที่เราต้องการจากคุณ
การแปลอ้างอิง
เราต้องการคู่การแปลที่ผ่านการคัดสรรสำหรับการประเมินผล — ภาษาอังกฤษด้านหนึ่ง และภาษาของคุณอีกด้านหนึ่ง สิ่งเหล่านี้จะกลายเป็น "เฉลยคำตอบ" ที่ใช้ตัดสินคะแนนของวิธีการแปลทั้งหมด
คุณอาจสร้างสิ่งเหล่านี้จาก:
- สื่อการศึกษา — แบบฝึกหัดในตำรา แผนการสอน ใบงาน
- เอกสารชุมชน — รายงานการประชุม จดหมายข่าว ประกาศต่าง ๆ
- วลีที่ใช้ในชีวิตประจำวัน — ข้อความใน UI ป้ายกำกับในแอป สำนวนที่ใช้บ่อย
- เนื้อหาทางวัฒนธรรม — เรื่องเล่า บทเพลง หรือคำอธิบาย (โดยได้รับอนุญาตที่เหมาะสม)
รูปแบบเป็น JSON ที่เรียบง่าย:
{
"entries": [
{ "id": 1, "source": "Hello", "reference": "tânisi" },
{ "id": 2, "source": "Thank you", "reference": "kinanâskomitin" }
]
}
การตรวจสอบการแปล
ทุกวิธีการที่อ้างว่าสามารถผลิตการแปลที่ใช้งานได้จำเป็นต้องผ่านการตรวจสอบโดยมนุษย์ ผู้พูดสองภาษาจะตรวจสอบผลลัพธ์และบอกเราว่าคอมพิวเตอร์แปลถูกต้องหรือไม่ — และที่สำคัญกว่านั้นคือ เหตุใด จึงแปลผิดพลาด
ข้อมูลการฝึกสอน
กฎไวยากรณ์ รายการพจนานุกรม รูปแบบทางสัณฐานวิทยา — สิ่งเหล่านี้คือทรัพยากรทางภาษาศาสตร์ที่ทำให้วิธีการแปลทำงานได้ ความรู้ของคุณเกี่ยวกับการทำงานของภาษาของคุณนั้นไม่มีโมเดล AI ใดสามารถทดแทนได้
สิ่งที่คุณได้รับตอบแทน
ความเป็นเจ้าของ
เมื่อวิธีการแปลถูกสร้างขึ้นสำหรับภาษาของคุณและได้รับการตรวจสอบบน Arena แล้ว ความเป็นเจ้าของจะถูกโอน ไปยังองค์กรกำกับดูแลของชุมชนคุณ คุณเป็นเจ้าของโค้ด น้ำหนักโมเดล และการใช้งาน
รายได้
เมื่อนักพัฒนาใช้วิธีการแปลภาษาของคุณผ่าน champollion API ชุมชนของคุณจะได้รับ 90% ของรายได้จาก API ส่วนที่เหลืออีก 10% ครอบคลุมค่าใช้จ่ายด้านโครงสร้างพื้นฐาน
การควบคุม
องค์กรกำกับดูแลของคุณควบคุม:
- ผู้ที่สามารถเข้าถึงวิธีการแปล
- การอนุญาตให้ใช้งานในเชิงพาณิชย์หรือไม่
- เงื่อนไขการกำหนดราคาที่ใช้บังคับ
- เวลาและวิธีการอัปเดต
- ข้อมูลที่ใช้สำหรับการพัฒนาต่อไป
วิธีการเข้าร่วม
- ติดต่อเรา — เปิด issue บน Arena repository หรือส่งอีเมลถึงผู้ดูแล
- อธิบายภาษาของคุณ — ภาษาของคุณอยู่ในตระกูลใด มีผู้พูดกี่คน ใช้ระบบการเขียนใดบ้าง มีทรัพยากรเชิงคำนวณอะไรบ้าง (FST พจนานุกรม คลังข้อมูล)
- เริ่มต้นจากสิ่งเล็กน้อย — แม้แต่คู่การแปลที่ผ่านการคัดสรรเพียง 50 คู่ก็เพียงพอที่จะสร้างชุดข้อมูลการประเมินและเปิดแทร็กลีดเดอร์บอร์ดใหม่
- เชื่อมต่อเรากับการกำกับดูแล — ใครในชุมชนของคุณมีอำนาจเหนือข้อมูลภาษาและเทคโนโลยี โมเดลอธิปไตยของ Arena ต้องการพันธมิตรด้านการกำกับดูแล
อธิปไตยของข้อมูล
ข้อมูลภาษาของคุณเป็นของคุณ Arena สร้างขึ้นบนหลักการ OCAP®:
- เราไม่เก็บรวบรวมหรือจัดเก็บข้อมูลทางภาษาของคุณบนเซิร์ฟเวอร์ของเรา
- วิธีการแปลใช้สถาปัตยกรรม
api— ข้อมูลการฝึกสอน พจนานุกรม และกฎไวยากรณ์ทั้งหมดจะอยู่บนโครงสร้างพื้นฐานที่คุณควบคุม - คุณเป็นผู้ตัดสินใจว่าใครสามารถพัฒนาวิธีการแปลสำหรับภาษาของคุณ
- คะแนนบนลีดเดอร์บอร์ดพิสูจน์ว่าวิธีการแปลทำงานได้ แต่ไม่ได้เป็นการอนุญาตให้นำไปใช้งาน
ดูเพิ่มเติม
- อธิปไตยของข้อมูล — กรอบการทำงาน OCAP, CARE และ Te Mana Raraunga ฉบับสมบูรณ์
- การโอนความเป็นเจ้าของ — สิ่งที่เกิดขึ้นเมื่อวิธีการแปลชนะ
- โมเดลเศรษฐกิจ — วิธีที่คะแนนกลายเป็นรายได้
- สนับสนุนภาษาที่มีทรัพยากรจำกัด — บริบททางเทคนิคสำหรับนักวิจัยที่ทำงานร่วมกับชุมชน