الانتقال إلى المحتوى الرئيسي

استراتيجية شراكة المدونات اللغوية: إنشاء مدونات التقييم من خلال أقسام اللسانيات الأكاديمية

الغرض. تقدّم هذه الوثيقة سير العمل الكامل لإنشاء مدونة لتقييم الترجمة الآلية من خلال شراكة مع قسم اللسانيات. وهي تغطي ما نحتاج من القسم أن يقدّمه، وما يجب أن تبدو عليه المدونة، وكيفية ختمها تشفيريًا، وكيفية عمل التقييم في بيئة معزولة (sandbox)، وما يحصل عليه القسم في المقابل. هذه هي الوثيقة التي تصطحبها معك إلى اجتماع مع شريك أكاديمي محتمل.

الجمهور المستهدف. رؤساء الأقسام، والباحثون الرئيسيون، ومنسقو البحوث، ومديرو برامج لغات الشعوب الأصلية في الجامعات التي لديها برامج نشطة لتوثيق اللغات أو معالجة اللغات الطبيعية.

الوثائق المصاحبة:

آخر تحديث: 2026-06-07


1. ما الذي تنتجه هذه الشراكة

مدونة تقييم مختومة: مجموعة منسّقة من أزواج النصوص المتوازية (اللغة المصدر ← اللغة الهدف) تصبح المرجع الأساسي لقياس جودة الترجمة الآلية. تُختبر الأساليب مقابل هذه المدونة في بيئة معزولة — ولا يطّلع المطوّرون أبدًا على بيانات الاختبار.

تنتج الشراكة ثلاثة مخرجات:

المخرجما هومن يتحكم به
مدونة التطويرأكثر من 100–200 زوج نصي متوازٍ علني لتطوير الأساليبتُنشر علنًا (CC BY-NC-SA 4.0 أو ما يعادلها)
مجموعة الاختبار الذهبية50–150 زوجًا نصيًا متوازيًا سريًا للتقييم الرسميمنظمة الحوكمة المجتمعية (مختومة تشفيريًا)
حزمة الاختبارات التشخيصية10–50 زوجًا تقابليًا موجّهًا لاختبار ظواهر لغوية محددةتُنشر علنًا

تتيح مدونة التطوير لأي شخص بناء أساليب الترجمة. وتضمن المجموعة الذهبية اختبار تلك الأساليب بنزاهة. وتكشف الحزمة التشخيصية أنماط إخفاق محددة (على سبيل المثال: «هل يستطيع هذا النظام التعامل مع ظاهرة الإحالة البعيدة (obviation)؟»).


2. ما الذي يحتاج القسم إلى القيام به

المرحلة 1: تصميم المدونة (2–4 أسابيع، من وقت الباحث)

القائد: الباحث الرئيسي أو باحث ما بعد الدكتوراه ذو الخبرة في اللغة الهدف.

  1. اختيار مجالات المواد المصدرية. اختر 4–6 مجالات واقعية تحتاج فيها مجتمعات اللغة فعليًا إلى الترجمة. يدعم تصنيفنا 16 مجالًا (انظر مواصفات المعيار المرجعي §2.7):

    الأولويةالمجالالسبب
    🔴 عاليةedu — التعليميالكتب المدرسية والمناهج — حاجة مجتمعية مباشرة
    🔴 عاليةgov — الحكوميوثائق المجالس المحلية والسياسات — حاجة يومية عملية
    🔴 عاليةmedical — الصحياستمارات استقبال العيادات والمعلومات الصحية — حساسة من حيث السلامة
    🟡 متوسطةconv — المحادثاتالكلام اليومي — يؤسس مستوى الطلاقة الأساسي
    🟡 متوسطةlegal — القانونيوثائق الحقوق والمعاهدات — ذات أهمية مجتمعية
    🟢 أقلliterary — الأدبي/الثقافيالقصص والتواريخ الشفوية — الحفاظ على الثقافة
  2. صياغة وثيقة تصميم المدونة التي تحدد:

    • الحجم المستهدف لكل قسم (development، gold_standard، diagnostic)
    • توزيع مستويات الصعوبة (انظر §3.3 أدناه)
    • تغطية السجلات اللغوية والمجالات
    • معايير اختيار الجمل المصدرية (لا نصوص اصطناعية، ولا نصوص كتابية مقدّسة فقط)
    • خطة استقطاب المتحدثين
  3. تقديم التصميم لنا للمراجعة. نتحقق من صحته مقابل مخطط المدونة (مواصفات المعيار المرجعي §2) ونعيد الملاحظات في غضون أسبوع واحد.

المرحلة 2: إنشاء الجمل المصدرية (4–8 أسابيع، من وقت المتحدثين)

القائد: منسق البحوث بالتعاون مع متحدثين ثنائيي اللغة.

  1. توليد أو اختيار الجمل المصدرية عبر المجالات ومستويات الصعوبة المخطط لها. يمكن أن تكون المصادر:

    • مواد ثنائية اللغة منشورة سابقًا (كتب مدرسية، وثائق حكومية)
    • جملًا مستخلصة حديثًا مصممة لتغطية ظواهر لغوية محددة
    • مواد مقتبسة من وثائق واقعية (جداول أعمال المجالس المحلية، استمارات العيادات، المواد التعليمية)
  2. يجب أن تحتوي كل جملة مصدرية على:

    • وسم المجال (من تصنيف الرموز الستة عشر)
    • وسم السجل اللغوي (محادثة، رسمي، تقني، احتفالي، تعليمي)
    • وسم السياق (تحية، تصريح، سؤال، تعليمات، سرد، تسمية، خطأ)
    • مستوى الصعوبة المقدّر (1–5، انظر §3.3)
    • وسم المصدر (textbook، elicited، corpus، gold_standard)
  3. ترجمة كل جملة مصدرية إلى اللغة الهدف، على يد متحدثين ثنائيي اللغة. تُعدّ الترجمات المرجعية المتعددة لكل مدخل قيّمة لكنها ليست مطلوبة.

  4. اختياريًا، إضافة تحليل صرفي لكل ترجمة مرجعية:

    • شرح بيني السطور (تفكيك مورفيم بمورفيم)
    • سلسلة وسوم FST (في حال وجود FST للغة)
    • ملاحظات المترجم حول المتغيرات اللهجية أو الغموض أو السياق الثقافي

المرحلة 3: ضمان الجودة (2–4 أسابيع)

القائد: لساني ذو خبرة في اللغة الهدف.

  1. المراجعة المتبادلة. يجب مراجعة كل ترجمة من قبل متحدث ثنائي اللغة إضافي واحد على الأقل لم يُنتج الترجمة الأصلية. يتحقق المراجع من:

    • هل الترجمة دقيقة؟
    • هل تبدو طبيعية؟
    • هل تقييم الصعوبة صحيح؟
    • هل توجد متغيرات مقبولة ينبغي تدوينها؟
  2. تمرير المدونة عبر أداة التحقق من المخطط لدينا. نوفر سكربتًا يتحقق من صحة المدونة مقابل مخطط المدخلات (مواصفات المعيار المرجعي §2.2). وهو يتحقق من:

    • وجود الحقول المطلوبة
    • صحة رموز المجالات
    • أن مستويات الصعوبة أعداد صحيحة من 1 إلى 5
    • عدم وجود معرّفات مكررة
    • ترميز الأحرف (تطبيع UTF-8 NFC)
  3. في حال وجود FST للغة، يجب تمرير الترجمات المرجعية عبره. ينبغي أن تكون كل كلمة في المرجع صالحة وفق FST. أما الكلمات غير الصالحة (الكلمات الدخيلة، والمستحدثات، وأسماء الأعلام) فيجب توثيقها في قائمة سماح.

المرحلة 4: التقسيم والختم (أسبوع واحد، من فريقنا الهندسي)

القائد: فريق Champollion، مع مراجعة من القسم.

  1. تقسيم طبقي. نقسّم المدونة إلى أجزاء باستخدام عينات عشوائية حتمية (البذرة العشوائية موثّقة وقابلة للتكرار):

    الجزءالحجم المستهدفالوصول
    development60% من المدخلات (بحد أدنى 100)علني
    gold_standard30% من المدخلات (بحد أدنى 50)سري، مختوم
    held_out10% من المدخلات (بحد أدنى 10)سري، مختوم، لا يُستخدم أبدًا حتى تفعيله

    يحافظ التقسيم على توزيع مستويات الصعوبة (عينات طبقية) بحيث يكون لكل جزء تمثيل متناسب عبر المستويات.

  2. الختم التشفيري لجزأي gold_standard وheld_out:

    1. SHA-256 hash of each entry (source + reference + metadata)
    2. SHA-256 hash of the complete segment file
    3. Segment file encrypted with AES-256-GCM
    4. Encryption key split using Shamir Secret Sharing (2-of-3 threshold)
    5. Key shares distributed to:
    - Share 1: Community governance organization
    - Share 2: Academic department partner
    - Share 3: Champollion project (escrow)
    6. Hash manifest published to a public commit (proves the corpus existed
    at a specific time without revealing its contents)
  3. جزء التطوير يُودَع في المستودع العام ويُنشر مع ترخيص كامل.

  4. الجزء التشخيصي علني أيضًا — فهو يختبر ظواهر لغوية محددة (انظر §3.4).

المرحلة 5: التكامل والإطلاق (1–2 أسبوع، من فريقنا الهندسي)

  1. إعداد منصة التقييم. نضيف اللغة إلى منصة التقييم:

    • إنشاء بطاقة اللغة أو التحقق منها
    • تسجيل المدونة في سجل مجموعات البيانات
    • إعداد مقاييس LYSS (LYSS-fst في حال توفر FST، وLYSS-eq في حال وجود قواعد فحص لغوي)
    • اختيار ملف التقييم الافتراضي (Profile A في حال توفر FST، وإلا Profile B)
  2. القياس المرجعي الأساسي. نُجري مسحًا بـ 12 نموذجًا مقابل جزء التطوير لملء لوحة الترتيب بالنتائج الأولية.

  3. الإعلان العام. تظهر اللغة على لوحة ترتيب Arena مع قياس مرجعي حي لجزء التطوير. ويُنسب الفضل للقسم بوصفه شريك المدونة.


3. ما الذي يجب أن تبدو عليه المدونة

3.1 الصيغة

كل ملف من ملفات المدونة هو وثيقة JSON تتبع المخطط الوارد في مواصفات المعيار المرجعي §2.1–§2.2:

{
"dataset": {
"id": "crk-ualberta-v1",
"version": "1.0",
"language_pair": "EN→CRK",
"source_language": "en",
"target_language": "crk",
"created": "2026-09-15",
"license": "CC-BY-NC-SA-4.0",
"provenance": ["textbook", "elicited", "gold_standard"]
},
"entries": [
{
"id": 1,
"source": "I see the dog",
"reference": "niwâpamâw atim",
"segment": "development",
"difficulty": 2,
"provenance": "textbook",
"register": "conversational",
"context": "declaration",
"domain": "edu",
"morphological_analysis": "ni-wâpam-âw atim | 1sg-see.TA-3sg.DIR dog.AN",
"notes": "Animate noun (atim); direct form because speaker is proximate"
}
]
}

3.2 متطلبات الحجم الأدنى

الجزءالحد الأدنى من المدخلاتالموصى به
development100200–300
gold_standard50100–150
diagnostic1030–50
held_out1020–30
المجموع170350–530

3.3 توزيع مستويات الصعوبة

يجب أن تتضمن المدونة مدخلات عبر جميع مستويات الصعوبة الخمسة، مع ترجيح المستويات 2–4:

المستوىالوصفالتوزيع المستهدف
1 — مفردات أساسيةكلمات مفردة، تحيات شائعة، أرقام10–15%
2 — جمل بسيطةفاعل-فعل-مفعول، زمن المضارع25–30%
3 — تعقيد متوسطزمنا الماضي/المستقبل، الملكية، التمييز بين الحي وغير الحي30–35%
4 — صرف معقدالإحالة البعيدة (obviation)، المبني للمجهول، النسق المتصل، الجمل الموصولة15–20%
5 — متقدمجمل متعددة العبارات، سجل رسمي، احتفالي، اصطلاحي5–10%

3.4 حزمة الاختبارات التشخيصية

يختبر الجزء التشخيصي ظواهر لغوية محددة باستخدام أزواج تقابلية: ترجمة واحدة صحيحة وترجمة أخرى غير صحيحة تختلف عنها اختلافًا طفيفًا. إذا منح مقياس النظام الترجمةَ الصحيحة درجة أعلى، يجتاز الاختبار.

بالنسبة للغات متعددة التركيب، ينبغي أن تستهدف الحزمة التشخيصية:

الظاهرةمثال (لغة الكري Cree)ما تختبره
مطابقة الحيويةatim (حيّ) مقابل maskisin (غير حيّ) — صيغ فعلية مختلفةهل يعرف النظام أي الأسماء حيّة؟
الإحالة البعيدة (Obviation)ضمير الغائب القريب مقابل البعيدهل يتتبع تراتبية ضمائر الغائب؟
التعليم العكسيصيغ الفعل المباشرة مقابل العكسيةهل يتعامل مع حالة تفوّق المفعول على الفاعل؟
المتصل/المستقلترتيب الفعل في الجملة الرئيسية مقابل الجملة التابعةهل يستخدم النموذج الفعلي الصحيح؟
الشمول/الاستثناء«نحن (بما فيكم أنتم)» مقابل «نحن (باستثنائكم)»هل يميّز صيغ المتكلم الجمع؟

بالنسبة للعائلات اللغوية الأخرى، حدّد الظواهر الثلاث إلى الخمس الأكثر دلالة في التمييز بين الترجمة الكفؤة وغير الكفؤة. والخبرة اللسانية للقسم أساسية هنا — فهذه هي الاختبارات التي لا يعرف صياغتها إلا متخصص.

3.5 ما لا نريده

النمط المرفوضالسبب
نصوص كتابية مقدّسة فقطسجل لغوي قديم، ومفردات طقسية، وبنية نمطية. قيّم OMT-1600 بهذه الطريقة 1,560 لغة — ونحن نتجنبها عمدًا.
أزواج تقييم اصطناعيةالمراجع المولّدة بنماذج اللغة الكبيرة تُفرغ التقييم من معناه. يجب أن يكون المرجع من تأليف بشري.
مدونات أحادية السجل اللغويكلها رسمية، أو كلها محادثات. الترجمة الواقعية تشمل سجلات لغوية متعددة.
مستوى الصعوبة 1 فقطالكلمات المفردة والتحيات لا تختبر الترجمة — بل تختبر البحث في المعجم.
مراجع مترجمة آليًااستخدام مخرجات Google Translate كـ«مرجع» هو استدلال دائري.
جمل بدون وسم سياقنحتاج إلى معرفة الوظيفة التواصلية لأغراض التحليل التشخيصي.

4. الختم التشفيري والاختبار في البيئة المعزولة

4.1 لماذا نختم مجموعة الاختبار؟

تنشر المعايير المرجعية التقليدية في تعلّم الآلة مجموعات الاختبار علنًا. وبمجرد نشرها، ستتدرب نماذج اللغة الكبيرة الرائدة عليها في نهاية المطاف (عمدًا أو من خلال كشط الويب)، مما يجعل النتائج غير موثوقة. أما بيانات لغات الشعوب الأصلية، فثمة مصدر قلق إضافي: يمكن استخدام البيانات اللغوية المنشورة دون موافقة المجتمع.

يضمن الختم:

  • سلامة مجموعة الاختبار: لا يمكن للأساليب فرط التكيّف مع بيانات لم ترها قط
  • سيادة البيانات: يتحكم المجتمع في من يجري التقييم على بياناته
  • النضارة الدائمة: لا تتلوث مجموعة الاختبار أبدًا

4.2 كيف يعمل الاختبار في البيئة المعزولة

Developer workflow:
1. Developer builds a translation method using the PUBLIC development corpus
2. Developer tests locally against the development segment (unlimited, self-serve)
3. When ready, developer submits their complete method (code + config + coaching data)
4. Governance org installs the method in the evaluation sandbox
5. Sandbox runs the method against the SEALED gold-standard test set
6. Only scores are returned to the developer
7. Developer never sees the source sentences or reference translations

The sandbox:
- Runs on governance-controlled infrastructure
- Has selective network access (LLM APIs only, no exfiltration)
- Produces a tamper-proof run card (SHA-256 hash of all inputs and outputs)
- Logs all execution for audit purposes
- Can be inspected by the governance org at any time

4.3 إدارة المفاتيح

يُقسَّم مفتاح تشفير مجموعة الاختبار المختومة باستخدام مشاركة سر Shamir بعتبة 2 من 3:

حامل الحصةالدورصلاحية الإلغاء
منظمة الحوكمة المجتمعيةالوصي الرئيسييمكنها إلغاء صلاحية التقييم من جانب واحد
القسم الأكاديمي الشريكوصي مشاركيمكنه المشاركة في إعادة بناء المفتاح
مشروع Champollionالضمانلا يمكنه الوصول إلى البيانات بمفرده؛ يضمن الاستمرارية في حال تعذّر توفر الأطراف الأخرى

أي حصتين من ثلاث تعيدان بناء المفتاح. وهذا يعني:

  • يمكن للمجتمع + القسم الوصول إلى البيانات دون Champollion
  • يمكن للمجتمع + Champollion الوصول إلى البيانات دون القسم
  • لا يمكن لـ Champollion بمفرده أبدًا الوصول إلى البيانات

4.4 بيانات التجزئة

عند ختم المدونة، يُنشر بيان تجزئة (hash manifest) في إيداع Git علني:

{
"corpus_id": "crk-ualberta-v1",
"seal_date": "2026-09-15T00:00:00Z",
"segments": {
"development": {
"entry_count": 200,
"sha256": "a3f7c...",
"access": "public"
},
"gold_standard": {
"entry_count": 100,
"sha256": "b8d2e...",
"access": "sealed",
"key_scheme": "shamir-2-of-3"
},
"held_out": {
"entry_count": 20,
"sha256": "c9e4f...",
"access": "sealed",
"key_scheme": "shamir-2-of-3"
},
"diagnostic": {
"entry_count": 30,
"sha256": "d1a3b...",
"access": "public"
}
},
"total_entries": 350,
"manifest_sha256": "e2b5c..."
}

وهذا يثبت أن:

  • المدونة كانت موجودة في تاريخ محدد
  • لها حجم وبنية معروفان
  • أي تعديل على الأجزاء المختومة سيكسر سلسلة التجزئة
  • يمكن للمجتمع التحقق من أن بياناته لم تتعرض للتلاعب

5. ما الذي يحصل عليه القسم

5.1 البنية التحتية البحثية

الأصلالوصف
منصة التقييمإطار تقييم عامل ومختبر للغتهم — يوفّر شهورًا من بناء الأدوات
مقاييس LYSSمقاييس تقييم خاصة باللغة (LYSS-fst، LYSS-eq، LYSS-sem) مُعدّة للغتهم — في حال توفر موارد FST والمعجم
لوحة الترتيبلوحة ترتيب علنية وحية تعرض أحدث مستويات التقدم لزوجهم اللغوي
القياس المرجعي الأساسيمسح بـ 12 نموذجًا يوفر قياسات أساسية فورية قابلة للنشر
حزمة الاختبارات التشخيصيةاختبارات موجّهة لظواهر لغوية محددة — قابلة لإعادة الاستخدام في تقييمات أخرى

5.2 المنشورات العلمية

يدعم بناء المدونة ونتائج التقييم منشورات متعددة:

الورقة البحثيةالمنفذ العلميدور القسم
منهجية بناء المدونةLREC, ComputELمؤلف رئيسي أو مشارك
نتائج التقييم الأساسيةACL, EMNLPمؤلف مشارك
التحقق من مقياس LYSSWMT Metrics Shared Taskمؤلف مشارك
تصميم حزمة الاختبارات التشخيصيةSIGMORPHON, NAACLمؤلف رئيسي أو مشارك
موارد معالجة اللغات الطبيعية الخاصة باللغةمنافذ علمية خاصة باللغةمؤلف رئيسي

5.3 تعزيز فرص المنح

توفر الشراكة مخرجات ملموسة لمقترحات المنح البحثية:

  • «بنية تحتية مفتوحة المصدر لتقييم الترجمة الآلية للغة [اللغة]» — مخرج قابل للإثبات
  • «سيادة بيانات تشفيرية للبيانات اللغوية للشعوب الأصلية» — مبتكر وقابل للنشر
  • «معيار مرجعي بحوكمة مجتمعية مع لوحة ترتيب حية» — مقياس أثر مستمر
  • «تقييم مستقل لـ OMT-1600 / Google Translate للغة [اللغة]» — موضوع راهن وذو ظهور عالٍ

5.4 الأثر المجتمعي

  • يكتسب المجتمع اللغوي قدرة تقييم مستقلة — يمكنه تقييم ما إذا كان أي نظام ترجمة آلية (Google أو Meta أو نظام مخصص) يعمل فعليًا للغته
  • يتحكم المجتمع في بيانات الاختبار عبر وصاية المفتاح التشفيري
  • أي أساليب أثبتت جدارتها عبر المعيار المرجعي تنتقل ملكيتها إلى المجتمع (انظر مواصفات المعيار المرجعي §8.3)
  • تتدفق إيرادات الأساليب المنشورة إلى المجتمع (بنسبة تقسيم 90/10)

5.5 ما الذي يكلّفه ذلك القسم

المكوّنالتكلفة المقدّرةمن يدفع
وقت الباحث الرئيسي/باحث ما بعد الدكتوراه (التصميم، الإشراف)~40 ساعةالقسم (أو تمويل من منحة)
تعويضات المتحدثين (الترجمة)2,500–6,000 دولارتمويل من منحة أو من Champollion
تعويضات المتحدثين (المراجعة)500–1,500 دولارتمويل من منحة أو من Champollion
وقت منسق البحوث~20 ساعةالقسم
الهندسة، البنية التحتية، منصة التقييم0 دولارمشروع Champollion

نوفّر جميع أعمال الهندسة، وإعداد منصة التقييم، وتهيئة مقاييس LYSS، والتكامل مع لوحة الترتيب، والبنية التحتية المستمرة دون أي تكلفة على القسم. ومساهمة القسم هي الخبرة اللسانية والوصول إلى المتحدثين.


6. الجدول الزمني

المرحلةالمدةالمعلم الرئيسي
1: تصميم المدونة2–4 أسابيعاعتماد وثيقة التصميم
2: الجمل المصدرية + الترجمة4–8 أسابيعاكتمال المدونة الخام
3: ضمان الجودة2–4 أسابيعمراجعة متبادلة وتحقق من المخطط
4: الختمأسبوع واحدختم المجموعة الذهبية ونشر بيان التجزئة
5: التكامل1–2 أسبوعاللغة حية على لوحة الترتيب مع القياسات الأساسية
المجموع10–19 أسبوعًالوحة ترتيب حية مع تقييم مختوم

7. كيف تبدأ

  1. تواصل معنا — [البريد الإلكتروني/جهة الاتصال للمشروع]. سنحدد موعدًا لمكالمة مدتها 30 دقيقة لمناقشة لغتكم، والموارد المتاحة، ولوجستيات الشراكة.

  2. نوفر نحن:

    • هذه الوثيقة
    • مخطط المدونة وأدوات التحقق
    • أمثلة من مدونتنا الحالية للغة الكري (CRK)
    • قالب مسودة لتصميم المدونة
  3. توفرون أنتم:

    • باحثًا رئيسيًا أو باحث ما بعد دكتوراه لقيادة العمل اللساني
    • الوصول إلى متحدثين ثنائيي اللغة (أو خطة لاستقطابهم)
    • معلومات عن الموارد المتاحة (FST، المعجم، المدونات القائمة)
    • موافقة مؤسسية على حوكمة البيانات (الامتثال لـ OCAP® أو ما يعادله)
  4. نصمم المدونة بشكل مشترك — اختيار المجالات، وتوزيع الصعوبة، والاختبارات التشخيصية، والجدول الزمني، والميزانية.

  5. يبدأ العمل. نُجري متابعة أسبوعية. يتمتع القسم باستقلالية كاملة في القرارات اللسانية؛ ونتولى نحن جميع الأعمال الهندسية.


8. الأسئلة الشائعة

«لدينا بالفعل مدونة متوازية. هل يمكننا استخدامها؟»

نعم — إذا كان للمدونة مصدر واضح، وكانت من تأليف بشري، وكان الترخيص يسمح باستخدامها في التقييم. سنساعدكم على تنسيقها وفق مخططنا، وإضافة البيانات الوصفية الناقصة، ودمجها. يمكن للمدونات القائمة تسريع الجدول الزمني بشكل كبير (تخطي المرحلة 2 أو اختصارها إلى عملية سدّ ثغرات).

«ليس لدينا FST للغتنا.»

لا بأس. يتطلب LYSS-fst (الصحة الصرفية) وجود FST، لكن منصة التقييم تعمل بدونه باستخدام أوزان Profile B (chrF++ وBLEU وCOMET والمقاييس السلوكية). إذا كان هناك FST من GiellaLT للغة قريبة، فقد نتمكن من تكييفه. وإن لم يكن، فإن المدونة لا تزال تتيح تقييمًا قيّمًا — لكن دون بوابة التحقق من الصحة الصرفية.

«يستخدم متحدثونا نظام كتابة غير لاتيني.»

مدعوم بالكامل. يتعامل مخطط المدونة مع أي نظام كتابة من Unicode. صمّمنا للكتابة الرومانية المعيارية (SRO) والكتابة المقطعية للغة الكري، لكن البنية التحتية نفسها تعمل مع الديوناغارية، أو الكتابة العربية، أو نظم CJK، أو الإثيوبية، أو أي نظام كتابة آخر.

«ماذا عن التنوع اللهجي؟»

ضعوا له وسمًا. يتضمن مخطط مدخلات المدونة حقل notes للمعلومات اللهجية. إذا كانت لهجات متعددة ممثَّلة، فوثّقوها. يمكن إعداد فئات التكافؤ في أداة الفحص اللغوي (LYSS-eq) لقبول المتغيرات اللهجية كمكافئات. ويمكن أن تتضمن حزمة الاختبارات التشخيصية تقابلات خاصة باللهجات.

«من يملك المدونة؟»

المجتمع اللغوي، عبر منظمة الحوكمة. يُنسب الفضل للقسم بوصفه شريكًا بحثيًا. يحتفظ Champollion بحصة مفتاح ضمان لاستمرارية التشغيل لكنه لا يستطيع الوصول إلى البيانات المختومة بمفرده. ويُنشر جزء التطوير بترخيص Creative Commons يحدده المجتمع.

«ماذا لو أردنا التوقف؟»

يمكن للمجتمع إلغاء صلاحية التقييم في أي وقت برفض إعادة بناء مفتاح التشفير. ولا تُكشف البيانات المختومة أبدًا. أما جزء التطوير، المنشور بالفعل، فيبقى علنيًا بموجب ترخيصه. وتظل المخرجات البحثية للقسم (المنشورات والعروض) ملكًا له في جميع الأحوال.

«ماذا لو لم تكن منظمة الحوكمة قائمة بعد؟»

يمكننا البدء بالمراحل 1–3 (تصميم المدونة، الإنشاء، ضمان الجودة) دون منظمة حوكمة. يتطلب الختم (المرحلة 4) تحديد وصيّ مفتاح. وفي الفترة الانتقالية، يمكن للقسم أن يكون الوصي المشارك إلى جانب مشروع Champollion، على أن تنتقل الوصاية إلى منظمة الحوكمة المجتمعية عند تأسيسها.


ملحق: الوسم مقابل بناء المدونة

تغطي هذه الوثيقة بناء المدونة — إنشاء أزواج النصوص المتوازية التي تشكّل المرجع الأساسي للتقييم. أما الوسم (التحليل الصرفي، والشرح بيني السطور، وسلاسل وسوم FST) فهو نشاط منفصل يُثري المدونة لكنه غير مطلوب للتقييم الأساسي.

النشاطمطلوب؟ما الذي يتيحه
بناء المدونة (هذه الوثيقة)✅ مطلوبالتقييم الأساسي: chrF++، والمطابقة التامة، وCOMET، والمقاييس السلوكية
فحص تغطية FST🟡 اختياريمقياس الصحة الصرفية LYSS-fst
التحليل الصرفي🟡 اختياريمقياس morphological_accuracy (مواصفات التقييم §2.2)
قواعد التكافؤ لأداة الفحص اللغوي🟡 اختياريمقياس المطابقة المكافئة LYSS-eq
قواعد المدقق الدلالي🟡 اختياريمقياس التحقق الدلالي LYSS-sem
تقييمات الجودة من المتحدثيننشاط منفصلالتحقق من المقاييس (انظر بروتوكول التحقق من المتحدثين)

يغطي الوسمَ والتحققَ من المتحدثين وثائقُ منفصلة، ويمكن أن يجريا بالتوازي مع بناء المدونة أو بعده.