من المعيار إلى الاستخدام اليومي: مسار التحرير اللاحق

الخلاصة المختصرة. درجة في لوحة الصدارة ليست منتجًا. الطريق من "هذه الطريقة تحقق درجة 0.78" إلى "مكتب المجلس ينشر وثائق باللغة كل أسبوع" يمر عبر سير عمل واحد بالضبط: تنتج الآلة مسودة، ويصححها متحدث متمكن باللغة، ولا يُنشر إلا النص المصحَّح. كل عتبة جودة في مواصفاتنا مُعايَرة وفق سير العمل هذا — لا وفق مخرجات آلية غير خاضعة للإشراف، وهو أمر لا نقره لأي لغة على هذه المنصة.

يسأل الناس أحيانًا متى ستصبح طريقة ترجمة ما "جيدة بما يكفي للاستخدام المباشر." بالنسبة للغات التي تخدمها هذه الـ Arena، يحمل هذا السؤال فخًا في طياته. الإجابة الصادقة هي أن المعيار الجدير بالسعي إليه ليس "جيدة بما يكفي للنشر دون مراجعة" — بل "جيدة بما يكفي بحيث تكون مراجعة المسودة أفضل من الترجمة من الصفر." هذا المعيار أدنى بكثير، وهو قابل للقياس، وتجاوزه يغيّر ما يمكن لمكتب ترجمة مجتمعي إنتاجه في أسبوع.

سير العمل من البداية إلى النهاية

 English source document
        │
        ▼
 Machine draft  ←  a benchmarked, community-owned method
        │
        ▼
 Fluent-speaker post-edit  ←  the human gate; nothing skips it
        │
        ▼
 Published text  ←  carries human approval, not a machine score
        │
        ▼
 (Optional, community-controlled) corrections become
 data that improves the next version of the method

ثلاثة أمور تستحق الانتباه:

الآلة لا تنشر أبدًا. وحدة المخرجات هي مسودة. ومرحلة التصحيح التي يجريها المتحدث ليست ضمان جودة مُلحقًا في النهاية — بل هي سير العمل نفسه.
وقت المتحدث هو المورد الذي يجري تحسينه. الطريقة تكون أفضل من طريقة أخرى بقدر ما تترك للمتحدث أمورًا أقل لإصلاحها بالضبط. تُظهر الأبحاث حول التحرير اللاحق للغات وافرة الموارد باستمرار أنه أسرع من الترجمة من الصفر عند مستوى جودة متوسط للترجمة الآلية (Plitt & Masselot 2010؛ Green, Heer & Manning 2013، وكلاهما مذكور مع الروابط في الترجمة ليست إحياءً للغة). أما ما إذا كان ذلك ينطبق على اللغات متعددة التركيب فهو بالضبط ما وُجد المعيار لاكتشافه — ونحن نتعامل معه كفرضية تتطلب التحقق لكل لغة على حدة، وليس كافتراض مُسلَّم به.
حلقة التغذية الراجعة مملوكة. كل وثيقة مصحَّحة هي بيانات تدريب وتوجيه محتملة — وهي ملك للمجتمع، يعيد إدخالها (أو لا يفعل) وفق شروطه الخاصة بموجب قواعد سيادة البيانات. آلية التغذية الراجعة هدف تصميمي للمنصة، وليست ميزة مبنية بعد؛ انظر الإبلاغ عن الأخطاء وامتلاك التصحيحات لمعرفة الكيفية المقصودة لعمل التصحيحات وتتبّع المصدر.

ماذا تعني مستويات الجودة للاستخدام الفعلي

تمنح لوحة الصدارة الطرائق درجات وفق مقياس مركّب من المقاييس الآلية (مواصفات التقييم)، وتُترجم الدرجات إلى مستويات مسماة. وإليكم الترجمة الصادقة لتلك المستويات إلى لغة الاستخدام اليومي:

المستوى (composite)	ما يعنيه لمسار التحرير اللاحق
Baseline (0.00–0.30)	غير قابل للاستخدام لأي غرض. المخرجات في معظمها ليست اللغة الهدف. مفيد فقط كحد أدنى بحثي.
Emerging (0.30–0.50)	لا يزال غير صالح كأداة لإنتاج المسودات. تظهر أجزاء صحيحة، لكن المتحدث سيقضي في الإصلاح وقتًا أطول مما يقضيه في الكتابة من جديد.
Functional (0.50–0.70)	أول مستوى قد يتفوق فيه التحرير اللاحق على الترجمة من الصفر للنصوص السهلة — يستحق التجريب مع متحدث، لكنه لا يستحق الاعتماد عليه. تبقى أخطاء صرفية متكررة.
Deployable (0.70–0.85)	المستوى المستهدف لسير العمل أعلاه: مسودات يكون فيها معظم البناء الصرفي صحيحًا ويستطيع متحدث متمكن تصحيحها بسرعة أكبر بشكل ملموس من إعادة الترجمة. *"Deployable" تعني قابلًا للنشر ضمن سير عمل قائم على التحرير اللاحق* — وليس أبدًا "انشر دون مراجعة."**
Fluent (0.85–1.00)	يقترب من ترجمة بشرية كفؤة؛ الأخطاء نادرة وطفيفة. تبقى مرحلة المراجعة — لكنها تصبح أسرع فحسب.

تعلو هذا الجدول قاعدتان هيكليتان للنزاهة، مأخوذتان مباشرة من مواصفات المعيار §5 و§7:

المستويات الآلية تسميات مؤقتة، وليست أحكامًا نهائية. إنها ترشيحات للمراجعة البشرية. ستُعاد معايرة العتبات مع تراكم بيانات التحقق من المتحدثين، وقد تختلف نتائجها من لغة إلى أخرى.
لا يمكن لأي طريقة ادعاء مستوى Deployable أو أعلى دون مراجعة مجتمعية. تُرسل عينة طبقية من مخرجاتها إلى متحدثين ثنائيي اللغة، يقيّمون كل ترجمة بدرجات مرفوض / مفهوم إجمالًا / مقبول / ممتاز. والمنظمة الحوكمية — لا لوحة الصدارة — هي التي تقرر ما إذا كانت الطريقة ستتقدم.

للمقارنة، تصف عتبة جائزة المؤسس (composite ≥ 0.80، و≥99% كلمات صحيحة صرفيًا، و≥70% من تقييمات المتحدثين بدرجة مقبول أو أفضل) طريقةً تكون أخطاؤها المتبقية أخطاء لغوية حقيقية — تصريف خاطئ، لا كلمات مُختلَقة. هذا ما تبدو عليه "مسودة تستحق وقت المتحدث" بالأرقام.

من طريقة فائزة إلى مكتب عامل

لنفترض أن طريقة ما اجتازت تلك البوابات. الخطوات المتبقية تنظيمية، وهي محددة المواصفات لا مرتجلة:

انتقال الملكية. يصبح كود الطريقة ملكًا للمنظمة الحوكمية للمجتمع — ويحتفظ المطوّر بحقوق النسبة والنشر العلمي (نقل الملكية).
تحوّل الطريقة إلى خدمة. تُغلَّف كمكوّن إضافي وتُقدَّم عبر منصة النشر، مع تحكم المجتمع في الوصول والتسعير والاستخدامات المسموح بها (النشر إلى بيئة الإنتاج).
يدمجها المترجمون في يومهم. يوجّه مكتب الترجمة سير عمله الوثائقي القائم نحو واجهة API الخاصة بالطريقة: نص مصدر يدخل، مسودة تخرج، تحرير لاحق، ثم نشر. النص المنشور يحمل اسم المترجم وسلطته — الآلة أداة على مكتبه، مثل القاموس.
الإيرادات تتبع الاستخدام. يدفع المطوّرون الخارجيون الذين يستخدمون الطريقة أسعارًا محسوبة وفق الاستخدام، ويتدفق 90% من تلك الإيرادات إلى المنظمة الحوكمية (النموذج الاقتصادي) — التي يمكنها تمويل المزيد من ساعات المترجمين، فتكتمل الحلقة.

أين تقف الأمور اليوم

بصراحة: المسار الكامل محدد المواصفات من البداية إلى النهاية، ومبني جزئيًا. توجد منظومة التقييم والمقاييس وبطاقات التشغيل ولوحة الصدارة العامة؛ وتوجد مدونة تطوير لغة Plains Cree وجائزة فعالة؛ وتوجد منصة النشر. أما واجهة المراجعة المجتمعية وبيئة التقييم التجريبية وحلقة التغذية الراجعة للنصوص المصححة فهي محددة المواصفات لكنها غير عاملة بعد — وتشير المواصفات إلى أنها مخطط لها، ونحن نقول الأمر نفسه. لم تُكمل أي طريقة حتى الآن الرحلة الكاملة من المعيار إلى الاستخدام المجتمعي اليومي. تلك الرحلة هي تعريف المشروع للنجاح، وهذا بالضبط سبب امتناعنا عن ادعائه قبل أوانه.

ماذا يعني هذا لك

:::info إذا كنت من أفراد المجتمع شارة "Deployable" على لوحة الصدارة لا تعني أبدًا أن آلة ستنشر بلغتك دون إشراف — بل تعني أن مولّد مسودات قد يكون جاهزًا للاختبار أمام مترجميكم، وفق شروطكم، ومع متحدثيكم في موقع الحَكَم (بأجر — انظر كيف يتقاضى المتحدثون أجورهم). إذا كان مجتمعك يدير مكتب ترجمة، فالسؤال المهم الذي ينبغي طرحه علينا هو: "كيف سيبدو المشروع التجريبي، ومن سيراجع المخرجات؟" :::

:::info إذا كنت باحثًا يغيّر إطار التحرير اللاحق ما يستحق القياس: الوقت اللازم للوصول إلى نص مقبول مع وجود متحدث في الحلقة، وليس مجرد درجة composite. مقاييس الـ Arena بدائل تقريبية لذلك (مواصفات التقييم §1)، ودراسات التحرير اللاحق لكل لغة على حدة في اللغات المعقدة صرفيًا تمثل فجوة بحثية مفتوحة صُممت هذه البنية التحتية لدعمها. :::

:::info إذا كنت مطوّرًا حسِّن من أجل المحرِّر، لا من أجل المقياس. الطريقة التي تنتج كلمات حقيقية مع تصريفات خاطئة أحيانًا يمكن للمتحدث إصلاحها في ثوانٍ؛ أما الطريقة التي تختلق صيغًا تبدو معقولة فتُفسد سير العمل بأكمله — ولهذا تخضع الصحة الصرفية لشروط صارمة جدًا هنا. ابدأ من إرسال طريقة، واقرأ واجهة الطريقة لمعرفة ما ستسلّمه في النهاية إذا فزت. :::

انظر أيضًا

الترجمة ليست إحياءً للغة — لماذا البوابة البشرية هي جوهر الأمر، لا قيدًا عليه
الإبلاغ عن الأخطاء وامتلاك التصحيحات — ماذا يحدث عندما يكون النص المنشور خاطئًا رغم كل شيء
مواصفات المعيار §7 — بوابة التحقق البشري، بصيغتها الرسمية

سير العمل من البداية إلى النهاية​

ماذا تعني مستويات الجودة للاستخدام الفعلي​

من طريقة فائزة إلى مكتب عامل​

أين تقف الأمور اليوم​

ماذا يعني هذا لك​

انظر أيضًا​