لمجتمعات اللغات
ملخص تنفيذي. دليل موجَّه للمتحدثين باللغات الأصلية واللغات منخفضة الموارد يشرح كيفية المساهمة في Arena (الترجمات المرجعية، ومراجعة الترجمات، وبيانات التدريب اللغوي) وما يحصل عليه المجتمع في المقابل (ملكية الشيفرة البرمجية، وعائدات API، والتحكم الكامل في النشر). لا حاجة إلى البرمجة.
لست بحاجة إلى أن تكون مبرمجًا للمساهمة في Arena. إذا كنت تتحدث لغة أصلية أو لغة منخفضة الموارد، فأنت الشخص الأهم في هذه المنظومة.
ما نحتاجه منك
الترجمات المرجعية
نحتاج إلى أزواج ترجمة منسَّقة لأغراض التقييم — الإنجليزية في جانب، ولغتك في الجانب الآخر. تصبح هذه الأزواج "مفتاح الإجابة" الذي تُقيَّم على أساسه جميع طرق الترجمة.
يمكنك إنشاء هذه الأزواج من:
- المواد التعليمية — تمارين الكتب المدرسية، وخطط الدروس، وأوراق العمل
- وثائق المجتمع — محاضر الاجتماعات، والنشرات الإخبارية، والإعلانات
- العبارات اليومية — نصوص واجهات المستخدم، وتسميات التطبيقات، والتعابير الشائعة
- المحتوى الثقافي — القصص أو الأغاني أو الأوصاف (مع الأذونات المناسبة)
التنسيق هو ملف JSON بسيط:
{
"entries": [
{ "id": 1, "source": "Hello", "reference": "tânisi" },
{ "id": 2, "source": "Thank you", "reference": "kinanâskomitin" }
]
}
مراجعة الترجمات
كل طريقة تدّعي إنتاج ترجمات صالحة تحتاج إلى تحقق بشري. يراجع المتحدثون ثنائيو اللغة المخرجات ويخبروننا ما إذا كان الحاسوب قد أصاب — والأهم من ذلك، لماذا أخطأ.
بيانات التدريب اللغوي
القواعد النحوية، ومداخل القواميس، والأنماط الصرفية — هذه هي الموارد اللغوية التي تجعل طرق الترجمة تعمل. معرفتك بكيفية عمل لغتك لا يمكن لأي نموذج ذكاء اصطناعي أن يحل محلها.
ما الذي تحصل عليه في المقابل
الملكية
عندما تُبنى طريقة ترجمة للغتك ويتم التحقق منها على Arena، فإن الملكية تنتقل إلى منظمة الحوكمة الخاصة بمجتمعك. أنتم تمتلكون الشيفرة البرمجية، وأوزان النموذج، وعملية النشر.
العائدات
عندما يستخدم المطورون طريقة لغتك عبر champollion API، يحصل مجتمعك على 90% من عائدات API. أما نسبة 10% المتبقية فتغطي تكاليف البنية التحتية.
التحكم
تتحكم منظمة الحوكمة الخاصة بكم في:
- مَن يمكنه الوصول إلى الطريقة
- ما إذا كان يمكن استخدامها تجاريًا
- شروط التسعير المطبَّقة
- متى وكيف يتم تحديثها
- البيانات المستخدمة في التطوير اللاحق
كيفية المشاركة
- تواصل معنا — افتح مشكلة (issue) على مستودع Arena أو راسل المشرفين عبر البريد الإلكتروني
- صِف لغتك — إلى أي عائلة لغوية تنتمي؟ كم عدد المتحدثين بها؟ ما أنظمة الكتابة المستخدمة؟ ما الموارد الحاسوبية المتوفرة (FSTs، قواميس، مدوّنات نصية)؟
- ابدأ بخطوات صغيرة — حتى 50 زوج ترجمة منسَّقًا تكفي لإنشاء مجموعة بيانات تقييم وفتح مسار جديد في لوحة المتصدرين
- اربطنا بجهة الحوكمة — مَن في مجتمعك يملك السلطة على بيانات اللغة والتقنية؟ يتطلب نموذج السيادة في Arena شريكًا في الحوكمة
سيادة البيانات
بيانات لغتك ملك لك. بُنيت Arena على مبادئ OCAP®:
- لا نجمع بياناتك اللغوية أو نخزّنها على خوادمنا أبدًا
- تستخدم طرق الترجمة بنية
api— تبقى جميع بيانات التدريب اللغوي والقواميس والقواعد النحوية على بنية تحتية تتحكمون فيها - أنتم تقررون مَن يمكنه تطوير طرق للغتكم
- نتائج لوحة المتصدرين تثبت أن الطريقة تعمل؛ لكنها لا تمنح الإذن بنشرها
انظر أيضًا
- سيادة البيانات — الإطار الكامل لمبادئ OCAP وCARE وTe Mana Raraunga
- نقل الملكية — ماذا يحدث عندما تفوز طريقة ما
- النموذج الاقتصادي — كيف تتحول النتائج إلى عائدات
- دعم لغة منخفضة الموارد — سياق تقني للباحثين العاملين جنبًا إلى جنب مع المجتمعات