الانتقال إلى المحتوى الرئيسي

إطار عمل تصميم مدونة التقييم

الإصدار: 1.0
الحالة: مسودة
الغرض: منهجية منظمة لبناء مدونات تقييم تُنتج تقييمات صحيحة وموثوقة وذات دلالة لغوية لجودة الترجمة. هذا هو المصدر المعتمد لكيفية تصميم مجموعات بيانات التقييم في Champollion وبنائها وصيانتها.


1. مبادئ التصميم

1.1 — لماذا لا نستخدم معايير القياس العامة؟

تتوفر المدونات المتوازية العامة (FLORES+ وTatoeba ومجموعات اختبار WMT وOPUS) لأغراض التطوير وتصحيح الأخطاء، لكنها مستبعدة من التقييم الرسمي للوحة المتصدرين. والسبب بسيط:

التلوث. تُدرَّب نماذج اللغة الكبيرة المتقدمة على كميات هائلة من البيانات المستخرجة من الويب. وأي نص متوازٍ كان متاحًا للعموم — لا سيما في مجموعات بيانات قياسية منسقة وواسعة الاستشهاد — من المرجح أن يكون موجودًا ضمن بيانات تدريبها. فعندما تقيّم GPT-4o على FLORES+ ويحقق 85 نقطة في chrF++، لا يمكنك التمييز بين "النموذج جيد في الترجمة" و"النموذج حفظ هذه الأزواج المحددة من الجمل". وهذه ليست مسألة نظرية — فقد أثبتت الأبحاث وجود آثار تلوث قابلة للقياس على معايير قياس الترجمة الآلية.

وبالنسبة إلى Champollion، يكتسب هذا الأمر أهمية بالغة للأسباب الآتية:

  • لوحة المتصدرين لدينا تقارن في المقام الأول طرقًا قائمة على نماذج اللغة الكبيرة
  • قيمتنا المقترحة تكمن في التقييم النزيه والصارم
  • المستخدمون المستهدفون لدينا (المجتمعات اللغوية) يتخذون قرارات النشر بناءً على هذه الدرجات

1.2 — المتطلبات الأساسية

يجب أن تستوفي كل مدونة تقييم في Champollion ما يلي:

المتطلبالمسوغ
من تأليف بشريلا بيانات اصطناعية. يجب أن تكون جميع النصوص المصدرية والترجمات المرجعية مكتوبة بأيدٍ بشرية. يجوز أن تساعد نماذج اللغة الكبيرة في المحاذاة والتنسيق لكن لا يجوز أبدًا أن تولّد المحتوى.
غير متاحة للعموم في صورة متوازيةيجوز أن يكون النص المصدري عامًا؛ ويجوز أن تكون الترجمات المرجعية عامة؛ لكن يجب ألا يكون الاقتران المحدد بينهما موجودًا كمدونة متوازية قابلة للتنزيل.
موثقة المصدريجب أن يكون لكل مدخل أصل موثق: الوثيقة المصدرية، والمترجم، والترخيص، والتاريخ.
مستندة إلى أسس لغويةيجب أن تُوجَّه التغطية بالخصائص التصنيفية اللغوية، لا بأخذ العينات العشوائي.
مقسمة حسب المجاليجب أن تغطي المدخلات مجالات نصية محددة بتمثيل مضبوط.
مصنفة حسب الصعوبةيجب أن تُسند إلى المدخلات مستويات صعوبة (1–5) بناءً على التعقيد البنيوي.
خاضعة لإدارة الإصداراتتُحدد إصدارات المدونة بتجزئة محتواها. ولا تكون الدرجات قابلة للمقارنة إلا ضمن الإصدار نفسه.
قابلة للمراجعة المجتمعيةيجب أن تكون الترجمات المرجعية قابلة للمراجعة من قِبل أفراد المجتمع اللغوي.

2. اختيار النصوص المصدرية

2.1 — تصنيف المجالات

يقيّم Champollion الترجمة لأغراض سياقات النشر العملية، لا التمارين الأكاديمية. ويعكس تصنيف المجالات أنواع النصوص الواقعية التي يواجهها مستخدمو الترجمة:

المجالالرمزالوصفأمثلة على المصادر
واجهة البرمجياتuiتسميات الأزرار، عناصر القوائم، رسائل الأخطاء، التلميحات، تدفقات التهيئة الأوليةسلاسل نصية لتطبيقات مفتوحة المصدر، بوابات التوثيق
رسمي/إداريadminوثائق حكومية، إشعارات قانونية، نماذج، بيانات سياساتمنشورات حكومية عامة، وثائق بلدية
تعليميeduمحتوى الكتب المدرسية، مواد الدروس، نصوص تعليميةمواد تعليمية منشورة، أدلة تدريس
سردي/أدبيlitقصص، نصوص ثقافية، تدوينات التاريخ الشفويكتب منشورة، أرشيفات ثقافية (بإذن)
محادثاتيconvحوارات، تبادلات شبيهة بالدردشة، تواصل كتابي غير رسميمدونات حوار منشورة، سيناريوهات، نصوص مقابلات
تقنيtechتوثيق واجهات برمجة التطبيقات، ملفات README، مواصفات تقنيةتوثيق المشاريع مفتوحة المصدر
صحي/طبيhealthمعلومات طبية موجهة للمرضى، رسائل الصحة العامةمنشورات صحية حكومية
إخباري/صحفيnewsمقالات إخبارية، بيانات صحفية، شؤون جاريةصحف مجتمعية، وسائل إعلام الشعوب الأصلية

2.2 — توزيع المجالات

ينبغي أن تستهدف مدونة التقييم القياسية التوزيع التالي. وقد تختلف النسب الدقيقة بحسب الزوج اللغوي بناءً على أنواع النصوص الأكثر صلة بالمجتمع المستهدف:

المجالالنسبة المستهدفةالمسوغ
واجهة البرمجيات25%سياق النشر الأساسي لمستخدمي champollion CLI
رسمي/إداري15%ترجمة عالية المخاطر ذات تبعات قانونية
تعليمي15%حالة استخدام جوهرية لإحياء اللغات
سردي/أدبي10%يختبر الدقائق الثقافية والمستوى الأدبي
محادثاتي10%يختبر المستوى غير الرسمي وأنماط الكلام الطبيعي
تقني10%يختبر الدقة واتساق المصطلحات
صحي/طبي10%عالي المخاطر، يختبر المفردات المتخصصة بالمجال
إخباري/صحفي5%يختبر المفردات المعاصرة والمستوى المحايد

2.3 — معايير اختيار المصادر

عند اختيار النصوص المصدرية لمدونة جديدة:

  1. توافق الترخيص. يجب أن يكون النص المصدري خاضعًا لترخيص يسمح باستخدامه في مدونة تقييم. يُفضل CC BY أو CC BY-SA أو الملكية العامة. وثّق الترخيص.

  2. الحداثة. يُفضل اختيار نصوص نُشرت خلال السنوات العشر الأخيرة. فاللغة تتطور — خاصة المفردات المتعلقة بالتقنية والحوكمة والطب.

  3. تنوع المستويات اللغوية. ابحث ضمن كل مجال عن نصوص بمستويات رسمية مختلفة. فالبيان الصحفي الحكومي (رسمي) ومنشور حكومي على وسائل التواصل الاجتماعي (غير رسمي) كلاهما ينتمي إلى مجال admin لكن بمستويين لغويين مختلفين.

  4. الصلة الثقافية. بالنسبة إلى لغات الشعوب الأصلية والأقليات، أعطِ الأولوية للنصوص التي تهم المجتمع — وثائق إدارة الأراضي، والمواد التعليمية باللغة، ونصوص الحفاظ على الثقافة — على النصوص التي تصادف وجودها في صورة متوازية.

  5. لا مصادر مترجمة آليًا. إذا أُنشئت وثيقة "متوازية" عبر تمرير النص الأصلي من خلال Google Translate ثم تحريره لاحقًا، فإنها غير مقبولة كترجمة مرجعية. يجب أن تكون الترجمة المرجعية ترجمة بشرية مستقلة.


3. نظام مستويات الصعوبة

3.1 — تعريفات المستويات

يُسند إلى كل مدخل مستوى صعوبة (1–5) بناءً على التعقيد البنيوي للنص المصدري، لا على صعوبة الترجمة (التي تختلف بحسب الطريقة).

المستوىالتسميةالخصائص البنيوية
1أوليجمل بسيطة. عبارة واحدة. زمن المضارع. مفردات شائعة. لا تعابير اصطلاحية. لا تراكيب متداخلة.
2متوسطجمل مركبة. عبارتان مرتبطتان بأداة عطف. زمن الماضي/المستقبل. بعض مفردات المجال.
3متقدمجمل معقدة. جمل تابعة، جمل موصولة. أزمنة مختلطة. مصطلحات متخصصة بالمجال. صيغة المبني للمجهول.
4خبيرجمل متداخلة متعددة. مستوى قانوني/تقني. تراكيب شرطية. مفاهيم مجردة. إحالات ثقافية.
5قصوىنثر كثيف يجمع تحديات متزامنة متعددة: تبعية متداخلة، إحالة ضمائر غامضة، تعابير ثقافية اصطلاحية، مستويات لغوية مختلطة، مفردات نادرة.

3.2 — عوامل الصعوبة المستندة إلى أسس لغوية

إلى جانب التعقيد البنيوي، تتأثر الصعوبة بالمسافة التصنيفية اللغوية بين اللغة المصدر واللغة الهدف. وتُستمد هذه العوامل من الخصائص التصنيفية في WALS وبيانات التصنيف في بطاقة اللغة:

العاملصعوبة منخفضةصعوبة عالية
ترتيب الكلماتنفس الترتيب الأساسي (مثل SVO→SVO)ترتيب أساسي مختلف (مثل SVO→SOV)
النمط الصرفينمط متشابه (مثل تحليلي→تحليلي)نمط مختلف (مثل تحليلي→متعدد التركيب)
الجنس النحوينفس النظام أو لا جنسالمصدر بلا جنس، والهدف ذو نظام جنس معقد
التشريف/المستوى اللغويلا توسيم للمستوى اللغويالهدف ذو نظام مستويات لغوية معقد (مثل اليابانية والكورية)
نظام الكتابةنفس نظام الكتابةنظام كتابة مختلف (يتطلب نقحرة)
الحيويةلا تمييز بناءً على الحيويةالهدف ذو مطابقة قائمة على الحيوية (مثل لغة الكري)
البيّنيةلا بيّنيةالهدف يوسّم مصدر المعلومة نحويًا

3.3 — توزيع المستويات

ينبغي أن تتضمن المدونة القياسية تقريبًا:

المستوىالنسبة المستهدفةالمسوغ
115%يحدد خط الأساس — حتى الطرق الضعيفة ينبغي أن تتعامل مع هذه
225%الترجمة العملية اليومية الأساسية
330%حيث تصبح الفروق في جودة الطرق مرئية
420%يفصل الطرق الجيدة عن الممتازة
510%اختبار السقف — قلة قليلة من الطرق ستتعامل مع هذه جيدًا

4. جودة الترجمة المرجعية

4.1 — متطلبات المترجمين

يجب أن تُنتج الترجمات المرجعية بأيدي بشر يستوفون ما يلي:

  1. متحدثون بطلاقة باللغة الهدف (لغة أم أو ما يعادلها)
  2. مُلمّون بالقراءة والكتابة في اللغتين المصدر والهدف
  3. على دراية بالمجال الخاص بالنص (مترجم طبي للنصوص الصحية، وهكذا)
  4. مستقلون — يجب ألا يطّلع المترجم على أي مخرجات ترجمة آلية للنص نفسه أثناء الترجمة

4.2 — موجز الترجمة

يتلقى كل مترجم موجزًا يتضمن:

  • المستوى اللغوي الواجب استخدامه (رسمي، محادثاتي، إلخ.)
  • الجمهور المستهدف (عامة الناس، متخصصون، أطفال، إلخ.)
  • أي اصطلاحات مصطلحية خاصة بالمجتمع اللغوي
  • تعليمات صريحة: "ترجم المعنى لا الكلمات. فالترجمة التي تبدو طبيعية أكثر قيمة من الترجمة الحرفية."

4.3 — ضمان الجودة

  1. الترجمة المزدوجة. في الوضع المثالي، يكون لكل مدخل ترجمتان مرجعيتان مستقلتان من مترجمَين مختلفَين. وحيث يتعذر ذلك، أعطِ الأولوية للترجمة المزدوجة للمستويين 4–5.

  2. المراجعة المجتمعية. ينبغي أن يراجع الترجمات المرجعية متحدث إضافي واحد على الأقل لم يشارك في إنتاج الترجمة.

  3. البدائل المقبولة. وثّق لكل ترجمة مرجعية البدائل المقبولة المعروفة (ترتيب الكلمات، الاصطلاحات الإملائية، الصيغ اللهجية). وتغذي هذه البدائل مقياس equivalent_match_rate.

4.4 — ما الذي يجعل الترجمة المرجعية رديئة

المشكلةلماذا تُبطل التقييم
مترجمة آليًا ثم محررة لاحقًايحافظ التحرير اللاحق على بنية الترجمة الآلية؛ مما يعاقب الطرق التي تنتج ترجمات أكثر طبيعية
مترجمة بواسطة متعلم وليس متحدثًا بطلاقةقد تحتوي الترجمة المرجعية على أخطاء تعاقب مخرجات الترجمة الآلية الصحيحة
حرفية بإفراطتحصل الترجمات الطبيعية على درجات منخفضة عند مقارنتها بمراجع حرفية
تفسير صحيح وحيد لمصدر غامضيعاقب التفسيرات البديلة الصحيحة

5. الوقاية من التلوث

5.1 — نموذج تهديدات التلوث

التهديدالوصفالتخفيف
تداخل بيانات التدريبنماذج لغة كبيرة مدربة على المدونة المتوازيةعدم نشر المدونة المتوازية للعموم
تسريب الأمثلة القليلة (few-shot)استخدام مؤلف الطريقة مدخلات التقييم كأمثلة few-shotفحص البصمة: تُكتشف المدخلات الموجودة في الموجّه (prompt) ويُعلَّم عليها
التلوث غير المباشروجود النص المصدري في بيانات تدريب النموذج (أحادي اللغة)مقبول — وجود النص المصدري أحادي اللغة متوقع. ويجب أن يكون الاقتران جديدًا.
التلوث الجماعيمشاركة المراجعين المجتمعيين المدخلات علنًاتحظر شروط الترخيص إعادة توزيع المدونة المتوازية

5.2 — مستويات سرية المدونة

المستوىالظهورالاستخدام
مجموعة التطوير العامةعامة بالكاملتطوير الطرق، تصحيح الأخطاء، اختبار الانحدار. لا تُنشر الدرجات في لوحة المتصدرين.
مجموعة التقييم المحجوزةالنص المصدري مرئي، والمراجع سريةالتقييم الرسمي للوحة المتصدرين. تتلقى الطرق النص المصدري وتعيد الترجمات؛ وتُحتسب الدرجات على الخادم. ولا تُكشف المراجع للطريقة أبدًا.
مجموعة المعيار الذهبيسرية بالكامل، تحت سيطرة المجتمعتقييم معتمد مجتمعيًا. تديره هيئة الحوكمة. تُستخدم لمستوى التحقق "Community Validated".

5.3 — سياسة التدوير

ينبغي تدوير مدونات التقييم دوريًا:

  1. بعد استخدام المدونة لمدة 12 شهرًا، ابدأ ببناء بديل لها
  2. حوّل المدونة القديمة إلى حالة "مجموعة تطوير" (عامة)
  3. رقِّ المدونة الجديدة إلى "مجموعة التقييم المحجوزة"
  4. يمنع هذا التلوث التدريجي الناتج عن التحسين التكراري على هدف ثابت

6. سير عمل بناء المدونة

6.1 — العملية خطوة بخطوة

Step 1: Language Pair Selection
└─ Identify target language, read language card
└─ Review typological features (WALS), contact influences, scripts
└─ Identify which difficulty factors apply

Step 2: Source Text Curation
└─ Identify candidate source documents per domain
└─ Verify licenses
└─ Extract candidate sentences/segments
└─ Classify by domain and preliminary difficulty tier

Step 3: Segment Selection
└─ Sample segments to match domain distribution (§2.2)
└─ Sample segments to match difficulty distribution (§3.3)
└─ Ensure linguistic phenomenon coverage (§6.2)
└─ Target minimum corpus size (§6.3)

Step 4: Reference Translation
└─ Assign segments to qualified translators
└─ Provide translation brief
└─ Collect translations
└─ Dual-translate Tier 4–5 entries

Step 5: Quality Assurance
└─ Community review of references
└─ Document acceptable variants
└─ Flag and resolve disagreements

Step 6: Metadata & Packaging
└─ Assign final difficulty tiers
└─ Add provenance metadata per entry
└─ Content-hash the corpus for versioning
└─ Package as corpus JSON per harness spec

Step 7: Registration
└─ Register in Supabase datasets table
└─ Add to ATTRIBUTION.md if new sources used
└─ Document in arena website

6.2 — تغطية الظواهر اللغوية

ينبغي أن تتضمن كل مدونة مدخلات تختبر ظواهر لغوية محددة ذات صلة بالزوج اللغوي. وتُستمد هذه من حقلَي linguisticChallenges وcontactInfluences في بطاقة اللغة:

ظواهر عامة (لجميع الأزواج اللغوية):

  • تحديد مرجع الضمائر (مراجع غامضة)
  • النفي (مفرد، مزدوج، نطاق النفي)
  • المُسوِّرات (الكل، البعض، لا شيء، الأغلب)
  • التعبيرات الزمنية (تواريخ نسبية، مُدد)
  • الكيانات المسماة (أشخاص، أماكن، منظمات)
  • الأرقام والقياسات
  • القوائم والتعداد

ظواهر خاصة بالزوج اللغوي (من بطاقة اللغة):

  • للغات الهدف متعددة التركيب: صرف الأفعال المعقد، الدمج
  • للغات الهدف ذات الجنس النحوي: مطابقة الجنس، الإشارة المحايدة/الشاملة
  • للغات الهدف ذات ترتيب SOV: الأفعال في نهاية الجملة، حروف الجر اللاحقة
  • للغات النغمية: التمييزات الدلالية المعتمدة على النغمة
  • للغات التشريفية: علامات المستوى اللغوي، السياق الاجتماعي
  • للغات التماس اللغوي: حدود التناوب اللغوي، إدماج الكلمات المستعارة

6.3 — الحد الأدنى لحجم المدونة

تتطلب الموثوقية الإحصائية أعدادًا دنيا من المدخلات. وتستند هذه إلى متطلبات فترات الثقة بطريقة البوتستراب المزدوج (paired bootstrap) (من significance.py):

الغرضالحد الأدنى من المدخلاتالموصى به
مجموعة التطوير50100–200
مجموعة التقييم المحجوزة100200–500
مجموعة المعيار الذهبي200500+
الحد الأدنى لكل مجال1025+
الحد الأدنى لكل مستوى1020+

لماذا 100 كحد أدنى للتقييم؟ مع أقل من ~100 مدخل، لا تستطيع اختبارات الدلالة الإحصائية بطريقة البوتستراب المزدوج (1,000 إعادة معاينة) أن تكشف بموثوقية الفروق الأصغر من ~5 نقاط chrF++. ومع 200 مدخل أو أكثر، يمكننا كشف فروق تبلغ ~نقطتين عند مستوى دلالة p<0.05.


7. تنسيق JSON للمدونة

يتبع كل مدخل في المدونة مواصفات إطار التقييم:

{
"id": "edtekla-dev-v1-042",
"source": "The school board will meet on Tuesday to discuss the new curriculum.",
"reference": "ᑭᓯᑭᓄᐦᐊᒫᑐᐏᓐ ᑲ ᐃᔑ ᐱᒥᐸᔨᐦᑕᐦᒃ ᑭᔅᑭᓄᐦᐊᒫᑐᐏᓇ ᐁ ᐃᔑ ᒫᒥᑐᓀᔨᐦᑕᐦᒃ ᐅᔥᑭ ᑭᔅᑭᓄᐦᐊᒫᑫᐏᓂᔭ ᓂᔓ ᑭᔑᑲᐤ",
"acceptable_variants": [
"ᑭᔅᑭᓄᐦᐊᒫᑐᐏᓐ ᓂᔓ ᑭᔑᑲᐤ ᑲ ᐃᔑ ᒫᒥᑐᓀᔨᐦᑕᐦᒃ ᐅᔥᑭ ᑭᔅᑭᓄᐦᐊᒫᑫᐏᓂᔭ"
],
"domain": "edu",
"difficulty": 3,
"phenomena": ["temporal_expression", "named_entity", "future_tense"],
"provenance": {
"source_doc": "EdTeKLA Module 4, Unit 7",
"source_license": "CC BY-NC-SA 4.0",
"translator": "anonymous-speaker-001",
"translator_qualification": "L1 Plains Cree, certified translator",
"translation_date": "2025-11-15",
"reviewer": "anonymous-speaker-002",
"review_date": "2025-12-01"
}
}

8. تدابير مكافحة التلاعب

8.1 — سلامة المدونة

التدبيرالتنفيذ
تجزئة المحتوىإصدار المدونة = SHA-256 لمعرفات المدخلات المرتبة + المراجع. وأي تعديل ينتج إصدارًا جديدًا.
بصمة المدخلاتلكل مدخل معرّف مشتق من المحتوى. وإذا قدّم أحدهم نتائج مقابل مدونة معدلة، فلن تتطابق البصمة.
إنفاذ الحجبفي التقييم الرسمي، تتلقى الطرق النص المصدري فقط. ولا تُكشف المراجع أبدًا. وتُحتسب الدرجات على الخادم.
جدول التدويرتُدوَّر المدونات سنويًا لمنع التحسين طويل الأمد على هدف ثابت.

8.2 — سلامة التقديمات

التدبيرالتنفيذ
بصمة حتميةتُجزَّأ إعدادات التشغيل (النموذج، درجة الحرارة، الموجّه، إصدار المدونة). وتنتج الإعدادات المتطابقة بصمات متطابقة.
كشف الانتقاء الانتهازييجب على المقدّمين الإفصاح عن جميع عمليات التشغيل، وليس الأفضل فقط. ويُعلَّم على التقديمات المتعددة ذات البصمة نفسها.
فحص التلوثإذا ظهرت مدخلات التقييم حرفيًا في موجّه الطريقة أو بيانات توجيهها، يُستبعد التقديم.

9. المدونات الحالية

9.1 — EDTeKLA Development Set v1

الخاصيةالقيمة
المعرّفedtekla-dev-v1
الزوج اللغويEN → CRK (Plains Cree، SRO)
المدخلات404 (master_corpus.json: 62 ذهبي + 342 من الكتب المدرسية)؛ 548 مدخلًا متاحًا إجمالًا
المجالاتتعليمي (100%)
المستويات1–5 (التوزيع قيد التحديد بانتظار تدقيق المدخلات)
الترخيصCC BY-NC-SA 4.0
الحالةمجموعة تطوير (عامة)

القيود: مجال واحد فقط (تعليمي). لا تقسيم حسب المجالات. قد تحتاج تصنيفات المستويات إلى تدقيق. ويحد صغر حجم المدونة من القوة الإحصائية لاختبارات الدلالة.

9.2 — المدونات المخطط لها

المدونةالزوج اللغويالحالةالمسؤول
مدونة مخصصة EN → TL (الفلبينية)EN → TLمخطط لهامالك المشروع
مجموعة محجوزة EN → CRKEN → CRKمستقبلية (تحتاج شريكًا مجتمعيًا)هيئة الحوكمة المجتمعية

10. التكامل مع بطاقة اللغة

يتكامل إطار عمل المدونة مع نظام بطاقات اللغة:

  1. اختيار المجالات يسترشد بحقل linguisticChallenges في البطاقة — فإذا كانت اللغة ذات تحديات فريدة (تعدد التركيب، النغمة، الحيوية)، يجب أن تتضمن المدونة مدخلات تختبرها.

  2. معايرة الصعوبة تستخدم حقل classification في البطاقة — فالمسافة التصنيفية اللغوية بين عائلتي اللغة المصدر والهدف تؤثر فيما يُعد "صعبًا".

  3. تغطية المستويات اللغوية تستخدم حقل registers في البطاقة — فإذا كانت اللغة ذات مستويات محددة (formal-filipino، taglish-professional، taglish-casual)، ينبغي أن تتضمن المدونة مدخلات عند كل مستوى.

  4. اختبار تأثير التماس اللغوي يستخدم حقل contactInfluences في البطاقة — بالنسبة إلى اللغات ذات طبقات الاقتراض الكثيفة (الفلبينية: إسبانية + إنجليزية + عربية)، أدرج مدخلات تختبر ما إذا كانت الطرق تتعامل مع الكلمات المستعارة بصورة صحيحة بدلًا من الإفراط في ترجمتها.

  5. التعامل مع أنظمة الكتابة يستخدم حقل scripts[] في البطاقة — بالنسبة إلى اللغات متعددة أنظمة الكتابة (الصربية: سيريلية + لاتينية)، أدرج مدخلات تختبر صحة اختيار نظام الكتابة.


المراجع

  • Champollion Scoring Specification — تحدد جميع المقاييس وأوزان الدرجة المركبة (composite) ومستويات الجودة
  • Champollion Benchmark Specification — بروتوكول التقييم وتنسيق المدونة وسيادة البيانات
  • WALS (World Atlas of Language Structures) — قاعدة بيانات الخصائص التصنيفية اللغوية
  • Glottolog — المصدر المعتمد لتصنيف اللغات
  • ISO 639-3 — معيار تحديد هوية اللغات
  • EdTeKLA — مصدر مدونة التقييم الأولى

هذه الوثيقة مواصفة حية. حدّثها مع بناء مدونات جديدة واكتساب دروس مستفادة.