الانتقال إلى المحتوى الرئيسي

الإبلاغ عن الأخطاء وملكية التصحيحات

الموقف. الوقوع في الخطأ أمر حتمي لأي منصة تنشر حقائق وتقييمات حول آلاف اللغات. أما ما هو غير حتمي فهو من يُصدَّق عند الإبلاغ عن خطأ، ومن يملك التصحيح. إجابتنا: بلاغ المتحدث المتمكّن يتفوق على أتمتتنا، وكل تصحيح يحمل مصدرًا (provenance) يوضّح من غيّر ماذا ولماذا، ويمكن لأي مجتمع لغوي أن يسحب بيانات لغته أو يستخدم حق النقض ضد استخدامها — ليس كمجاملة، بل كخاصية مُلزَمة في البنية المعمارية.

تتعامل معظم منصات البيانات مع بلاغات الأخطاء كتذاكر دعم فني: يشتكي مستخدم، ويقرر مشرف، ويتغير السجل بصمت. أما بالنسبة لبيانات لغات الشعوب الأصلية، فهذا النموذج مقلوب رأسًا على عقب. فالشخص الذي يبلّغ عن الخطأ عادةً ما يكون أكثر موثوقية من المنصة — المتحدث الذي يخبرنا أن كلمة ما خاطئة ليس مجرد "مستخدم"، بل هو الحقيقة المرجعية التي تصحّح وسيطًا تقريبيًا. والتصميم الموضح أدناه ينبثق من أخذ ذلك على محمل الجد.


نوعان من الخطأ، ومبدأ واحد

تنشر المنصة نوعين من الادعاءات التي يمكن أن تكون خاطئة:

  1. حقائق حول لغة ما — بطاقات اللغة التي تقود التقييم: بيانات التصنيف، نظام الكتابة الإملائي، الخصائص اللغوية، والمقاييس المطبّقة. قد تتضمن بطاقة ما تقديرًا خاطئًا لعدد المتحدثين، أو علاقة لهجية خاطئة، أو حالة خاطئة لنظام الكتابة.
  2. أحكام حول الترجمات — ترجمة مرجعية في مدوّنة لغوية يعتبرها متحدث خاطئة أو غير طبيعية؛ أو مقياس آلي يرفض كلمة صحيحة أو يقبل كلمة غير صحيحة؛ أو شارة "Deployable" على مخرجات لن يقبلها المتحدثون.

المبدأ الذي يغطي الحالتين معًا، والمُلزِم بالفعل في مواصفات التقييم ومواصفات المعيار §7: المخرجات الآلية وسائط تقريبية؛ والمتحدثون هم الحقيقة المرجعية. والالتزام المنشور في بروتوكول التحقق من المتحدثين §6 يقولها بصراحة: إذا قال متحدث إن أداة الفحص (linter) مخطئة في شيء ما، فإننا نصلح أداة الفحص.

كيف ينتقل البلاغ

إليك المسار الذي يسلكه البلاغ، مع مؤشرات حالة صادقة — بعض هذا يعمل اليوم، وبعضه موصّف ولم يُبنَ بعد.

الإبلاغ عن ترجمة سيئة أو حكم خاطئ لمقياس (يعمل اليوم، عبر قناة مباشرة). المتحدث الذي يلاحظ ترجمة مرجعية خاطئة، أو كلمة مرفوضة خطأً، أو "مكافئًا" غير مقبول، يمكنه الإبلاغ عن ذلك عبر متتبع المشكلات في المستودع العام للمشروع أو بالتواصل مع المشروع مباشرة. النسخة المنظَّمة من ذلك — شاشات تقييم تتضمن خيارات reject / gist / acceptable / excellent وملاحظات نصية حرة — هي واجهة المراجعة المجتمعية، الموصَّفة في مواصفات المعيار §7.3 لكنها ليست متاحة بعد. وإلى أن تصبح كذلك، تُعالَج البلاغات بشكل شخصي مباشر، وتبقى مهام التحقق نفسها (مراجعة مدفوعة ومنظَّمة من قبل المتحدثين — انظر كيف يحصل المتحدثون على أجورهم) هي خط التصحيح الرئيسي.

الإبلاغ عن حقيقة خاطئة في بطاقة لغة (يعمل اليوم، عبر القنوات نفسها). تتبع تصحيحات البطاقات المسار ذاته: بلاغ، مراجعة، تغيير مُوثَّق بإصدارات. ولأن البطاقات تقود سلوك التقييم — أي المقاييس التي تُحمَّل، والنماذج الموصى بها — فإن إصلاح بطاقة يمكن أن يغيّر النتائج، لذلك تُطبَّق التصحيحات كتغييرات مسجَّلة في البيانات، وليست أبدًا تعديلات صامتة.

ما يحدث بعد ذلك — من يقرر:

  • الأحكام اللغوية تعود إلى متحدثي تلك اللغة. ما إذا كانت صيغة ما صحيحة، أو ما إذا كانت صياغتان متكافئتين، أو ما إذا كان مستوى لغوي معين مناسبًا — المنصة تنفّذ الإجابة؛ ولا تقدّمها. وحيث يختلف المتحدثون (في اللهجات، أو الأعراف الإملائية)، تُسجَّل الإجابة كتنويع، ولا نفصل فيها نحن — فمخططات المدونات اللغوية وأدوات الفحص تدعم وسم المتغيرات اللهجية كبدائل مقبولة بدلًا من فرض فائز واحد.
  • القرارات المتعلقة ببيانات مجتمع لغوي تعود إلى منظمته الحوكمية. بالنسبة للغات التي لديها منظمة حوكمة، فإن التغييرات على مدونات التقييم، وقبول التصحيحات في مجموعات الاختبار المختومة، وتبعات النشر، كلها تمر عبر تلك المنظمة — وذلك هو مبدأ التحكّم (Control) في OCAP® منفَّذًا كإجراء عملي، لا كشعار.
  • الأخطاء التقنية البحتة تُصلَح فحسب. خطأ إملائي، رابط معطل، حقل مُحلَّل بشكل خاطئ — يُبلَّغ عنه، ويُصحَّح، ويُسجَّل. ليس كل شيء بحاجة إلى مجلس.

التصحيحات تحمل المصدر

التصحيح الذي لا يمكن تتبّعه هو مجرد رأي أحدث. تنطبق ثلاث قواعد للمصدر (provenance) على كل حقيقة وكل إصلاح:

  1. كل حقيقة تذكر مصدرها. تسجّل بطاقات اللغة ومدخلات المدونات اللغوية من أين جاءت كل قيمة — من مجموعة بيانات منشورة، أو مساهمة مجتمعية، أو مراجعة متحدث.
  2. القيم المشتقة تُوسَم بأنها قيمنا نحن، لا قيم المصدر الأصلي. عندما تحسب المنصة شيئًا — قيمة مجمَّعة، أو إعادة ترميز، أو قيمة مركّبة — يُسجَّل ذلك كاشتقاق من المنصة انطلاقًا من المصدر الأصلي، ولا يُكتب أبدًا باسم المصدر الأصلي. فلا ينبغي أبدًا تحميل مجموعة بيانات مصدرية مسؤولية رقم لم تنشره، ولا نسب الفضل إليها فيه.
  3. التصحيحات تصبح جزءًا من السجل. يُسجَّل تصحيح المتحدث كتأكيد جديد منسوب (باسمه أو بشكل مجهول، حسب اختيار المتحدث — بالشروط ذاتها المعمول بها في أعمال التحقق) يحل محل القيمة القديمة؛ ويبقى سجل التغييرات قابلًا للتدقيق. وإصدارات المدونات اللغوية مُوثَّقة ببصمات تجزئة (شراكة المدونات §4.4)، لذا فإن المدونة المصحَّحة هي إصدار جديد مرئي، وكل بطاقة تشغيل تسجّل بالضبط الإصدار الذي قُيِّمت بالاستناد إليه — تبقى النتائج القديمة قابلة للتفسير، وتعكس النتائج الجديدة الإصلاح.

حق النقض، بشكل ملموس

من السهل ادّعاء "التحكّم المجتمعي". إليك ما يتجسّد فيه ذلك في البنية المعمارية المنشورة:

  • يمكن للمتحدثين سحب مساهماتهم. يمكن للمتحدث سحب تقييماته في أي وقت، ويؤدي السحب إلى إزالتها من جميع التحليلات (التحقق من المتحدثين §5). كما يملك المتحدثون حق النقض على نشر نتائج يجدونها إشكالية.
  • يمكن للمجتمعات إيقاف التقييم كليًا. مجموعات الاختبار المختومة مشفَّرة، وتُحفَظ المفاتيح بحيث لا تستطيع المنصة وحدها إعادة بنائها أبدًا؛ ويمكن لأي مجتمع إلغاء صلاحية التقييم برفض المشاركة في إعادة بناء المفاتيح (شراكة المدونات §4.3). سؤال "ماذا لو أردنا التوقف؟" له إجابة موصَّفة: البيانات المختومة لا تُكشف أبدًا، وينتهي التقييم.
  • لا نتيجة تتجاوز قرارًا مجتمعيًا. الطريقة التي تتصدر لوحة الترتيب لا تُنشَر إلا إذا وافقت المنظمة الحوكمية (نقل الملكية) — والمجتمع الذي يقرر أن الترجمة الآلية لا ينبغي نشرها للغته إطلاقًا إنما يمارس النظام كما صُمِّم، لا يخرقه (انظر الترجمة ليست إحياءً لغويًا).

ما لم نبنه بعد

بروح بقية هذا القسم: واجهة المراجعة المجتمعية مخطَّط لها، وليست متاحة بعد. ولم تُؤسَّس منظمات حوكمة لأي من اللغات الحالية حتى الآن — الوصاية المجتمعية على معيار لغة Plains Cree قيد التأكيد، ونحن لا نسمّي الأوصياء علنًا قبل موافقتهم. وإلى أن تتوفر تلك الأجزاء، تمر التصحيحات عبر قنوات مباشرة قابلة للنسب، وتبقى المواصفات المنشورة — وليس هذه الصفحة — هي الوصف المُلزِم للعملية. وحيثما تتعارض هذه الصفحة مع مواصفة، تَغلِب المواصفة، ونعتبر التعارض نفسه خللًا يستحق الإبلاغ أيضًا.


ماذا يعني هذا لك

:::info إذا كنت من أفراد مجتمع لغوي إذا كان هناك شيء خاطئ بشأن لغتك على هذه المنصة — حقيقة، أو ترجمة، أو وسم — فبلاغك شهادة من الحقيقة المرجعية، وليس شكوى تُفرَز. أنت تقرر ما إذا كان تصحيحك يُنسَب إليك بالاسم؛ ويمكن سحب مساهمتك لاحقًا؛ ويمكن لمجتمعك إيقاف استخدام بياناته بشكل كامل. ابدأ من للمجتمعات اللغوية، أو افتح ببساطة مشكلة (issue) في المستودع العام. :::

:::info إذا كنت باحثًا التصحيحات هنا بيانات لها مصدر موثَّق، لا تعديلات صامتة: إصدارات المدونات اللغوية مُجزَّأة ببصمات تجزئة، وبطاقات التشغيل تثبّت الإصدار الدقيق الذي قُيِّمت بالاستناد إليه، والقيم المشتقة موسومة كاشتقاقات. إذا كنت تبني على نتائج Arena أو مدوناتها، فاستشهد بالإصدار — وتعامل مع موجة تصحيحات يقودها المتحدثون باعتبارها نتيجة بحثية حول صلاحية المقياس، لأنها كذلك فعلًا. :::

:::info إذا كنت مطوّرًا يمكن أن تتغير نتيجة طريقتك بشكل مشروع دون أن يتغير كودك — كلمة مرفوضة خطأً تُضاف إلى قائمة المسموح، أو ترجمة مرجعية تُصحَّح، أو فئة متغيرات تُصلَح. صمّم لذلك: ثبّت إصدارات المدونات اللغوية في بطاقات التشغيل الخاصة بك (مواصفة Run Card)، وتابع سجلات تغييرات مجموعات البيانات، وتعامل مع تصحيحات المتحدثين باعتبارها أوثق إشارة خطأ ستحصل عليها مجانًا على الإطلاق. :::

انظر أيضًا