إطار عمل تصميم مدونة التقييم

الإصدار: 1.0
الحالة: مسودة
الغرض: منهجية منظمة لبناء مدونات تقييم تُنتج تقييمات صحيحة وموثوقة وذات دلالة لغوية لجودة الترجمة. هذا هو المصدر المعتمد لكيفية تصميم مجموعات بيانات التقييم في Champollion وبنائها وصيانتها.

1. مبادئ التصميم

1.1 — لماذا لا نستخدم معايير القياس العامة؟

تتوفر المدونات المتوازية العامة (FLORES+ وTatoeba ومجموعات اختبار WMT وOPUS) لأغراض التطوير وتصحيح الأخطاء، لكنها مستبعدة من التقييم الرسمي للوحة المتصدرين. والسبب بسيط:

التلوث. تُدرَّب نماذج اللغة الكبيرة المتقدمة على كميات هائلة من البيانات المستخرجة من الويب. وأي نص متوازٍ كان متاحًا للعموم — لا سيما في مجموعات بيانات قياسية منسقة وواسعة الاستشهاد — من المرجح أن يكون موجودًا ضمن بيانات تدريبها. فعندما تقيّم GPT-4o على FLORES+ ويحقق 85 نقطة في chrF++، لا يمكنك التمييز بين "النموذج جيد في الترجمة" و"النموذج حفظ هذه الأزواج المحددة من الجمل". وهذه ليست مسألة نظرية — فقد أثبتت الأبحاث وجود آثار تلوث قابلة للقياس على معايير قياس الترجمة الآلية.

وبالنسبة إلى Champollion، يكتسب هذا الأمر أهمية بالغة للأسباب الآتية:

لوحة المتصدرين لدينا تقارن في المقام الأول طرقًا قائمة على نماذج اللغة الكبيرة
قيمتنا المقترحة تكمن في التقييم النزيه والصارم
المستخدمون المستهدفون لدينا (المجتمعات اللغوية) يتخذون قرارات النشر بناءً على هذه الدرجات

1.2 — المتطلبات الأساسية

يجب أن تستوفي كل مدونة تقييم في Champollion ما يلي:

المتطلب	المسوغ
من تأليف بشري	لا بيانات اصطناعية. يجب أن تكون جميع النصوص المصدرية والترجمات المرجعية مكتوبة بأيدٍ بشرية. يجوز أن تساعد نماذج اللغة الكبيرة في المحاذاة والتنسيق لكن لا يجوز أبدًا أن تولّد المحتوى.
غير متاحة للعموم في صورة متوازية	يجوز أن يكون النص المصدري عامًا؛ ويجوز أن تكون الترجمات المرجعية عامة؛ لكن يجب ألا يكون الاقتران المحدد بينهما موجودًا كمدونة متوازية قابلة للتنزيل.
موثقة المصدر	يجب أن يكون لكل مدخل أصل موثق: الوثيقة المصدرية، والمترجم، والترخيص، والتاريخ.
مستندة إلى أسس لغوية	يجب أن تُوجَّه التغطية بالخصائص التصنيفية اللغوية، لا بأخذ العينات العشوائي.
مقسمة حسب المجال	يجب أن تغطي المدخلات مجالات نصية محددة بتمثيل مضبوط.
مصنفة حسب الصعوبة	يجب أن تُسند إلى المدخلات مستويات صعوبة (1–5) بناءً على التعقيد البنيوي.
خاضعة لإدارة الإصدارات	تُحدد إصدارات المدونة بتجزئة محتواها. ولا تكون الدرجات قابلة للمقارنة إلا ضمن الإصدار نفسه.
قابلة للمراجعة المجتمعية	يجب أن تكون الترجمات المرجعية قابلة للمراجعة من قِبل أفراد المجتمع اللغوي.

2. اختيار النصوص المصدرية

2.1 — تصنيف المجالات

يقيّم Champollion الترجمة لأغراض سياقات النشر العملية، لا التمارين الأكاديمية. ويعكس تصنيف المجالات أنواع النصوص الواقعية التي يواجهها مستخدمو الترجمة:

المجال	الرمز	الوصف	أمثلة على المصادر
واجهة البرمجيات	`ui`	تسميات الأزرار، عناصر القوائم، رسائل الأخطاء، التلميحات، تدفقات التهيئة الأولية	سلاسل نصية لتطبيقات مفتوحة المصدر، بوابات التوثيق
رسمي/إداري	`admin`	وثائق حكومية، إشعارات قانونية، نماذج، بيانات سياسات	منشورات حكومية عامة، وثائق بلدية
تعليمي	`edu`	محتوى الكتب المدرسية، مواد الدروس، نصوص تعليمية	مواد تعليمية منشورة، أدلة تدريس
سردي/أدبي	`lit`	قصص، نصوص ثقافية، تدوينات التاريخ الشفوي	كتب منشورة، أرشيفات ثقافية (بإذن)
محادثاتي	`conv`	حوارات، تبادلات شبيهة بالدردشة، تواصل كتابي غير رسمي	مدونات حوار منشورة، سيناريوهات، نصوص مقابلات
تقني	`tech`	توثيق واجهات برمجة التطبيقات، ملفات README، مواصفات تقنية	توثيق المشاريع مفتوحة المصدر
صحي/طبي	`health`	معلومات طبية موجهة للمرضى، رسائل الصحة العامة	منشورات صحية حكومية
إخباري/صحفي	`news`	مقالات إخبارية، بيانات صحفية، شؤون جارية	صحف مجتمعية، وسائل إعلام الشعوب الأصلية

2.2 — توزيع المجالات

ينبغي أن تستهدف مدونة التقييم القياسية التوزيع التالي. وقد تختلف النسب الدقيقة بحسب الزوج اللغوي بناءً على أنواع النصوص الأكثر صلة بالمجتمع المستهدف:

المجال	النسبة المستهدفة	المسوغ
واجهة البرمجيات	25%	سياق النشر الأساسي لمستخدمي champollion CLI
رسمي/إداري	15%	ترجمة عالية المخاطر ذات تبعات قانونية
تعليمي	15%	حالة استخدام جوهرية لإحياء اللغات
سردي/أدبي	10%	يختبر الدقائق الثقافية والمستوى الأدبي
محادثاتي	10%	يختبر المستوى غير الرسمي وأنماط الكلام الطبيعي
تقني	10%	يختبر الدقة واتساق المصطلحات
صحي/طبي	10%	عالي المخاطر، يختبر المفردات المتخصصة بالمجال
إخباري/صحفي	5%	يختبر المفردات المعاصرة والمستوى المحايد

2.3 — معايير اختيار المصادر

عند اختيار النصوص المصدرية لمدونة جديدة:

توافق الترخيص. يجب أن يكون النص المصدري خاضعًا لترخيص يسمح باستخدامه في مدونة تقييم. يُفضل CC BY أو CC BY-SA أو الملكية العامة. وثّق الترخيص.
الحداثة. يُفضل اختيار نصوص نُشرت خلال السنوات العشر الأخيرة. فاللغة تتطور — خاصة المفردات المتعلقة بالتقنية والحوكمة والطب.
تنوع المستويات اللغوية. ابحث ضمن كل مجال عن نصوص بمستويات رسمية مختلفة. فالبيان الصحفي الحكومي (رسمي) ومنشور حكومي على وسائل التواصل الاجتماعي (غير رسمي) كلاهما ينتمي إلى مجال admin لكن بمستويين لغويين مختلفين.
الصلة الثقافية. بالنسبة إلى لغات الشعوب الأصلية والأقليات، أعطِ الأولوية للنصوص التي تهم المجتمع — وثائق إدارة الأراضي، والمواد التعليمية باللغة، ونصوص الحفاظ على الثقافة — على النصوص التي تصادف وجودها في صورة متوازية.
لا مصادر مترجمة آليًا. إذا أُنشئت وثيقة "متوازية" عبر تمرير النص الأصلي من خلال Google Translate ثم تحريره لاحقًا، فإنها غير مقبولة كترجمة مرجعية. يجب أن تكون الترجمة المرجعية ترجمة بشرية مستقلة.

3. نظام مستويات الصعوبة

3.1 — تعريفات المستويات

يُسند إلى كل مدخل مستوى صعوبة (1–5) بناءً على التعقيد البنيوي للنص المصدري، لا على صعوبة الترجمة (التي تختلف بحسب الطريقة).

المستوى	التسمية	الخصائص البنيوية
1	أولي	جمل بسيطة. عبارة واحدة. زمن المضارع. مفردات شائعة. لا تعابير اصطلاحية. لا تراكيب متداخلة.
2	متوسط	جمل مركبة. عبارتان مرتبطتان بأداة عطف. زمن الماضي/المستقبل. بعض مفردات المجال.
3	متقدم	جمل معقدة. جمل تابعة، جمل موصولة. أزمنة مختلطة. مصطلحات متخصصة بالمجال. صيغة المبني للمجهول.
4	خبير	جمل متداخلة متعددة. مستوى قانوني/تقني. تراكيب شرطية. مفاهيم مجردة. إحالات ثقافية.
5	قصوى	نثر كثيف يجمع تحديات متزامنة متعددة: تبعية متداخلة، إحالة ضمائر غامضة، تعابير ثقافية اصطلاحية، مستويات لغوية مختلطة، مفردات نادرة.

3.2 — عوامل الصعوبة المستندة إلى أسس لغوية

إلى جانب التعقيد البنيوي، تتأثر الصعوبة بالمسافة التصنيفية اللغوية بين اللغة المصدر واللغة الهدف. وتُستمد هذه العوامل من الخصائص التصنيفية في WALS وبيانات التصنيف في بطاقة اللغة:

العامل	صعوبة منخفضة	صعوبة عالية
ترتيب الكلمات	نفس الترتيب الأساسي (مثل SVO→SVO)	ترتيب أساسي مختلف (مثل SVO→SOV)
النمط الصرفي	نمط متشابه (مثل تحليلي→تحليلي)	نمط مختلف (مثل تحليلي→متعدد التركيب)
الجنس النحوي	نفس النظام أو لا جنس	المصدر بلا جنس، والهدف ذو نظام جنس معقد
التشريف/المستوى اللغوي	لا توسيم للمستوى اللغوي	الهدف ذو نظام مستويات لغوية معقد (مثل اليابانية والكورية)
نظام الكتابة	نفس نظام الكتابة	نظام كتابة مختلف (يتطلب نقحرة)
الحيوية	لا تمييز بناءً على الحيوية	الهدف ذو مطابقة قائمة على الحيوية (مثل لغة الكري)
البيّنية	لا بيّنية	الهدف يوسّم مصدر المعلومة نحويًا

3.3 — توزيع المستويات

ينبغي أن تتضمن المدونة القياسية تقريبًا:

المستوى	النسبة المستهدفة	المسوغ
1	15%	يحدد خط الأساس — حتى الطرق الضعيفة ينبغي أن تتعامل مع هذه
2	25%	الترجمة العملية اليومية الأساسية
3	30%	حيث تصبح الفروق في جودة الطرق مرئية
4	20%	يفصل الطرق الجيدة عن الممتازة
5	10%	اختبار السقف — قلة قليلة من الطرق ستتعامل مع هذه جيدًا

4. جودة الترجمة المرجعية

4.1 — متطلبات المترجمين

يجب أن تُنتج الترجمات المرجعية بأيدي بشر يستوفون ما يلي:

متحدثون بطلاقة باللغة الهدف (لغة أم أو ما يعادلها)
مُلمّون بالقراءة والكتابة في اللغتين المصدر والهدف
على دراية بالمجال الخاص بالنص (مترجم طبي للنصوص الصحية، وهكذا)
مستقلون — يجب ألا يطّلع المترجم على أي مخرجات ترجمة آلية للنص نفسه أثناء الترجمة

4.2 — موجز الترجمة

يتلقى كل مترجم موجزًا يتضمن:

المستوى اللغوي الواجب استخدامه (رسمي، محادثاتي، إلخ.)
الجمهور المستهدف (عامة الناس، متخصصون، أطفال، إلخ.)
أي اصطلاحات مصطلحية خاصة بالمجتمع اللغوي
تعليمات صريحة: "ترجم المعنى لا الكلمات. فالترجمة التي تبدو طبيعية أكثر قيمة من الترجمة الحرفية."

4.3 — ضمان الجودة

الترجمة المزدوجة. في الوضع المثالي، يكون لكل مدخل ترجمتان مرجعيتان مستقلتان من مترجمَين مختلفَين. وحيث يتعذر ذلك، أعطِ الأولوية للترجمة المزدوجة للمستويين 4–5.
المراجعة المجتمعية. ينبغي أن يراجع الترجمات المرجعية متحدث إضافي واحد على الأقل لم يشارك في إنتاج الترجمة.
البدائل المقبولة. وثّق لكل ترجمة مرجعية البدائل المقبولة المعروفة (ترتيب الكلمات، الاصطلاحات الإملائية، الصيغ اللهجية). وتغذي هذه البدائل مقياس equivalent_match_rate.

4.4 — ما الذي يجعل الترجمة المرجعية رديئة

المشكلة	لماذا تُبطل التقييم
مترجمة آليًا ثم محررة لاحقًا	يحافظ التحرير اللاحق على بنية الترجمة الآلية؛ مما يعاقب الطرق التي تنتج ترجمات أكثر طبيعية
مترجمة بواسطة متعلم وليس متحدثًا بطلاقة	قد تحتوي الترجمة المرجعية على أخطاء تعاقب مخرجات الترجمة الآلية الصحيحة
حرفية بإفراط	تحصل الترجمات الطبيعية على درجات منخفضة عند مقارنتها بمراجع حرفية
تفسير صحيح وحيد لمصدر غامض	يعاقب التفسيرات البديلة الصحيحة

5. الوقاية من التلوث

5.1 — نموذج تهديدات التلوث

التهديد	الوصف	التخفيف
تداخل بيانات التدريب	نماذج لغة كبيرة مدربة على المدونة المتوازية	عدم نشر المدونة المتوازية للعموم
تسريب الأمثلة القليلة (few-shot)	استخدام مؤلف الطريقة مدخلات التقييم كأمثلة few-shot	فحص البصمة: تُكتشف المدخلات الموجودة في الموجّه (prompt) ويُعلَّم عليها
التلوث غير المباشر	وجود النص المصدري في بيانات تدريب النموذج (أحادي اللغة)	مقبول — وجود النص المصدري أحادي اللغة متوقع. ويجب أن يكون الاقتران جديدًا.
التلوث الجماعي	مشاركة المراجعين المجتمعيين المدخلات علنًا	تحظر شروط الترخيص إعادة توزيع المدونة المتوازية

5.2 — مستويات سرية المدونة

المستوى	الظهور	الاستخدام
مجموعة التطوير العامة	عامة بالكامل	تطوير الطرق، تصحيح الأخطاء، اختبار الانحدار. لا تُنشر الدرجات في لوحة المتصدرين.
مجموعة التقييم المحجوزة	النص المصدري مرئي، والمراجع سرية	التقييم الرسمي للوحة المتصدرين. تتلقى الطرق النص المصدري وتعيد الترجمات؛ وتُحتسب الدرجات على الخادم. ولا تُكشف المراجع للطريقة أبدًا.
مجموعة المعيار الذهبي	سرية بالكامل، تحت سيطرة المجتمع	تقييم معتمد مجتمعيًا. تديره هيئة الحوكمة. تُستخدم لمستوى التحقق "Community Validated".

5.3 — سياسة التدوير

ينبغي تدوير مدونات التقييم دوريًا:

بعد استخدام المدونة لمدة 12 شهرًا، ابدأ ببناء بديل لها
حوّل المدونة القديمة إلى حالة "مجموعة تطوير" (عامة)
رقِّ المدونة الجديدة إلى "مجموعة التقييم المحجوزة"
يمنع هذا التلوث التدريجي الناتج عن التحسين التكراري على هدف ثابت

6. سير عمل بناء المدونة

6.1 — العملية خطوة بخطوة

Step 1: Language Pair Selection
    └─ Identify target language, read language card
    └─ Review typological features (WALS), contact influences, scripts
    └─ Identify which difficulty factors apply

Step 2: Source Text Curation
    └─ Identify candidate source documents per domain
    └─ Verify licenses
    └─ Extract candidate sentences/segments
    └─ Classify by domain and preliminary difficulty tier

Step 3: Segment Selection
    └─ Sample segments to match domain distribution (§2.2)
    └─ Sample segments to match difficulty distribution (§3.3)
    └─ Ensure linguistic phenomenon coverage (§6.2)
    └─ Target minimum corpus size (§6.3)

Step 4: Reference Translation
    └─ Assign segments to qualified translators
    └─ Provide translation brief
    └─ Collect translations
    └─ Dual-translate Tier 4–5 entries

Step 5: Quality Assurance
    └─ Community review of references
    └─ Document acceptable variants
    └─ Flag and resolve disagreements

Step 6: Metadata & Packaging
    └─ Assign final difficulty tiers
    └─ Add provenance metadata per entry
    └─ Content-hash the corpus for versioning
    └─ Package as corpus JSON per harness spec

Step 7: Registration
    └─ Register in Supabase datasets table
    └─ Add to ATTRIBUTION.md if new sources used
    └─ Document in arena website

6.2 — تغطية الظواهر اللغوية

ينبغي أن تتضمن كل مدونة مدخلات تختبر ظواهر لغوية محددة ذات صلة بالزوج اللغوي. وتُستمد هذه من حقلَي linguisticChallenges وcontactInfluences في بطاقة اللغة:

ظواهر عامة (لجميع الأزواج اللغوية):

تحديد مرجع الضمائر (مراجع غامضة)
النفي (مفرد، مزدوج، نطاق النفي)
المُسوِّرات (الكل، البعض، لا شيء، الأغلب)
التعبيرات الزمنية (تواريخ نسبية، مُدد)
الكيانات المسماة (أشخاص، أماكن، منظمات)
الأرقام والقياسات
القوائم والتعداد

ظواهر خاصة بالزوج اللغوي (من بطاقة اللغة):

للغات الهدف متعددة التركيب: صرف الأفعال المعقد، الدمج
للغات الهدف ذات الجنس النحوي: مطابقة الجنس، الإشارة المحايدة/الشاملة
للغات الهدف ذات ترتيب SOV: الأفعال في نهاية الجملة، حروف الجر اللاحقة
للغات النغمية: التمييزات الدلالية المعتمدة على النغمة
للغات التشريفية: علامات المستوى اللغوي، السياق الاجتماعي
للغات التماس اللغوي: حدود التناوب اللغوي، إدماج الكلمات المستعارة

6.3 — الحد الأدنى لحجم المدونة

تتطلب الموثوقية الإحصائية أعدادًا دنيا من المدخلات. وتستند هذه إلى متطلبات فترات الثقة بطريقة البوتستراب المزدوج (paired bootstrap) (من significance.py):

الغرض	الحد الأدنى من المدخلات	الموصى به
مجموعة التطوير	50	100–200
مجموعة التقييم المحجوزة	100	200–500
مجموعة المعيار الذهبي	200	500+
الحد الأدنى لكل مجال	10	25+
الحد الأدنى لكل مستوى	10	20+

لماذا 100 كحد أدنى للتقييم؟ مع أقل من ~100 مدخل، لا تستطيع اختبارات الدلالة الإحصائية بطريقة البوتستراب المزدوج (1,000 إعادة معاينة) أن تكشف بموثوقية الفروق الأصغر من ~5 نقاط chrF++. ومع 200 مدخل أو أكثر، يمكننا كشف فروق تبلغ ~نقطتين عند مستوى دلالة p<0.05.

7. تنسيق JSON للمدونة

يتبع كل مدخل في المدونة مواصفات إطار التقييم:

{
  "id": "edtekla-dev-v1-042",
  "source": "The school board will meet on Tuesday to discuss the new curriculum.",
  "reference": "ᑭᓯᑭᓄᐦᐊᒫᑐᐏᓐ ᑲ ᐃᔑ ᐱᒥᐸᔨᐦᑕᐦᒃ ᑭᔅᑭᓄᐦᐊᒫᑐᐏᓇ ᐁ ᐃᔑ ᒫᒥᑐᓀᔨᐦᑕᐦᒃ ᐅᔥᑭ ᑭᔅᑭᓄᐦᐊᒫᑫᐏᓂᔭ ᓂᔓ ᑭᔑᑲᐤ",
  "acceptable_variants": [
    "ᑭᔅᑭᓄᐦᐊᒫᑐᐏᓐ ᓂᔓ ᑭᔑᑲᐤ ᑲ ᐃᔑ ᒫᒥᑐᓀᔨᐦᑕᐦᒃ ᐅᔥᑭ ᑭᔅᑭᓄᐦᐊᒫᑫᐏᓂᔭ"
  ],
  "domain": "edu",
  "difficulty": 3,
  "phenomena": ["temporal_expression", "named_entity", "future_tense"],
  "provenance": {
    "source_doc": "EdTeKLA Module 4, Unit 7",
    "source_license": "CC BY-NC-SA 4.0",
    "translator": "anonymous-speaker-001",
    "translator_qualification": "L1 Plains Cree, certified translator",
    "translation_date": "2025-11-15",
    "reviewer": "anonymous-speaker-002",
    "review_date": "2025-12-01"
  }
}

8. تدابير مكافحة التلاعب

8.1 — سلامة المدونة

التدبير	التنفيذ
تجزئة المحتوى	إصدار المدونة = SHA-256 لمعرفات المدخلات المرتبة + المراجع. وأي تعديل ينتج إصدارًا جديدًا.
بصمة المدخلات	لكل مدخل معرّف مشتق من المحتوى. وإذا قدّم أحدهم نتائج مقابل مدونة معدلة، فلن تتطابق البصمة.
إنفاذ الحجب	في التقييم الرسمي، تتلقى الطرق النص المصدري فقط. ولا تُكشف المراجع أبدًا. وتُحتسب الدرجات على الخادم.
جدول التدوير	تُدوَّر المدونات سنويًا لمنع التحسين طويل الأمد على هدف ثابت.

8.2 — سلامة التقديمات

التدبير	التنفيذ
بصمة حتمية	تُجزَّأ إعدادات التشغيل (النموذج، درجة الحرارة، الموجّه، إصدار المدونة). وتنتج الإعدادات المتطابقة بصمات متطابقة.
كشف الانتقاء الانتهازي	يجب على المقدّمين الإفصاح عن جميع عمليات التشغيل، وليس الأفضل فقط. ويُعلَّم على التقديمات المتعددة ذات البصمة نفسها.
فحص التلوث	إذا ظهرت مدخلات التقييم حرفيًا في موجّه الطريقة أو بيانات توجيهها، يُستبعد التقديم.

9. المدونات الحالية

9.1 — EDTeKLA Development Set v1

الخاصية	القيمة
المعرّف	`edtekla-dev-v1`
الزوج اللغوي	EN → CRK (Plains Cree، SRO)
المدخلات	404 (`master_corpus.json`: 62 ذهبي + 342 من الكتب المدرسية)؛ 548 مدخلًا متاحًا إجمالًا
المجالات	تعليمي (100%)
المستويات	1–5 (التوزيع قيد التحديد بانتظار تدقيق المدخلات)
الترخيص	CC BY-NC-SA 4.0
الحالة	مجموعة تطوير (عامة)

القيود: مجال واحد فقط (تعليمي). لا تقسيم حسب المجالات. قد تحتاج تصنيفات المستويات إلى تدقيق. ويحد صغر حجم المدونة من القوة الإحصائية لاختبارات الدلالة.

9.2 — المدونات المخطط لها

المدونة	الزوج اللغوي	الحالة	المسؤول
مدونة مخصصة EN → TL (الفلبينية)	EN → TL	مخطط لها	مالك المشروع
مجموعة محجوزة EN → CRK	EN → CRK	مستقبلية (تحتاج شريكًا مجتمعيًا)	هيئة الحوكمة المجتمعية

10. التكامل مع بطاقة اللغة

يتكامل إطار عمل المدونة مع نظام بطاقات اللغة:

اختيار المجالات يسترشد بحقل linguisticChallenges في البطاقة — فإذا كانت اللغة ذات تحديات فريدة (تعدد التركيب، النغمة، الحيوية)، يجب أن تتضمن المدونة مدخلات تختبرها.
معايرة الصعوبة تستخدم حقل classification في البطاقة — فالمسافة التصنيفية اللغوية بين عائلتي اللغة المصدر والهدف تؤثر فيما يُعد "صعبًا".
تغطية المستويات اللغوية تستخدم حقل registers في البطاقة — فإذا كانت اللغة ذات مستويات محددة (formal-filipino، taglish-professional، taglish-casual)، ينبغي أن تتضمن المدونة مدخلات عند كل مستوى.
اختبار تأثير التماس اللغوي يستخدم حقل contactInfluences في البطاقة — بالنسبة إلى اللغات ذات طبقات الاقتراض الكثيفة (الفلبينية: إسبانية + إنجليزية + عربية)، أدرج مدخلات تختبر ما إذا كانت الطرق تتعامل مع الكلمات المستعارة بصورة صحيحة بدلًا من الإفراط في ترجمتها.
التعامل مع أنظمة الكتابة يستخدم حقل scripts[] في البطاقة — بالنسبة إلى اللغات متعددة أنظمة الكتابة (الصربية: سيريلية + لاتينية)، أدرج مدخلات تختبر صحة اختيار نظام الكتابة.

المراجع

Champollion Scoring Specification — تحدد جميع المقاييس وأوزان الدرجة المركبة (composite) ومستويات الجودة
Champollion Benchmark Specification — بروتوكول التقييم وتنسيق المدونة وسيادة البيانات
WALS (World Atlas of Language Structures) — قاعدة بيانات الخصائص التصنيفية اللغوية
Glottolog — المصدر المعتمد لتصنيف اللغات
ISO 639-3 — معيار تحديد هوية اللغات
EdTeKLA — مصدر مدونة التقييم الأولى

هذه الوثيقة مواصفة حية. حدّثها مع بناء مدونات جديدة واكتساب دروس مستفادة.

1. مبادئ التصميم​

1.1 — لماذا لا نستخدم معايير القياس العامة؟​

1.2 — المتطلبات الأساسية​

2. اختيار النصوص المصدرية​

2.1 — تصنيف المجالات​

2.2 — توزيع المجالات​

2.3 — معايير اختيار المصادر​

3. نظام مستويات الصعوبة​

3.1 — تعريفات المستويات​

3.2 — عوامل الصعوبة المستندة إلى أسس لغوية​

3.3 — توزيع المستويات​

4. جودة الترجمة المرجعية​

4.1 — متطلبات المترجمين​

4.2 — موجز الترجمة​

4.3 — ضمان الجودة​

4.4 — ما الذي يجعل الترجمة المرجعية رديئة​

5. الوقاية من التلوث​

5.1 — نموذج تهديدات التلوث​

5.2 — مستويات سرية المدونة​

5.3 — سياسة التدوير​

6. سير عمل بناء المدونة​

6.1 — العملية خطوة بخطوة​

6.2 — تغطية الظواهر اللغوية​

6.3 — الحد الأدنى لحجم المدونة​

7. تنسيق JSON للمدونة​

8. تدابير مكافحة التلاعب​

8.1 — سلامة المدونة​

8.2 — سلامة التقديمات​

9. المدونات الحالية​

9.1 — EDTeKLA Development Set v1​

9.2 — المدونات المخطط لها​

10. التكامل مع بطاقة اللغة​

المراجع​