الترجمة ليست إحياءً للغة
الموقف. الترجمة الآلية تحوّل النصوص بين اللغات. أما إحياء اللغة فيخلق متحدثين جددًا. هذان نشاطان مختلفان لهما معايير نجاح مختلفة، ولا يوجد أي تقييم في لوحة المتصدرين يغيّر من ذلك. نحن نبني الترجمة الآلية كبنية تحتية تخدم أهداف المجتمع — ولا نبنيها أبدًا كبديل عن النقل بين الأجيال. فالأطفال يتعلمون اللغة من البشر، لا من الآلات.
في عام 2026 من السهل الاعتقاد بأن البرمجيات قادرة على إصلاح أي شيء، بما في ذلك لغة تفقد متحدثيها. نريد أن نكون دقيقين في توضيح سبب خطأ هذا الاعتقاد — وفي بيان ما يمكن لتقنية الترجمة أن تسهم به بصدق.
هذه المقالة موجودة لأن لغويًا دعوناه لنقد هذا المشروع طرح الحجة بقوة: نظام ترجمة مثالي من الإنجليزية إلى لغة Cree لن يحل مشكلة النقل (عدم تعلّم الأطفال اللغة في المنزل)، ولا مشكلة المكانة (الإنجليزية بوصفها لغة القوة الاقتصادية)، ولا المشكلة التربوية (عدم وجود ما يكفي من مدارس الانغماس اللغوي والمعلمين المدرَّبين). بل قد يزيد الأمور سوءًا، عبر خلق وهم أن "الحاسوب يستطيع التحدث بلغة Cree" وتخفيف الإحساس بإلحاحية النقل البشري. لقد قبلنا معظم هذا النقد، وننشر ردنا هنا بدلًا من إخفائه.
ما الذي يتطلبه إحياء اللغة فعلًا
الأدبيات البحثية حول إحياء اللغات متسقة في نقطة واحدة: اللغات تبقى حية عندما تنتقل بين الأجيال — عندما يتحدث بها الآباء والأجداد والمجتمعات مع الأطفال، ويكبر الأطفال وهم يتحدثون بها بدورهم (Fishman 1991؛ Hinton & Hale 2001). وكل ما عدا ذلك — المدارس ووسائل الإعلام والقواميس والتطبيقات — إما أن يدعم هذا النقل أو لا يدعم شيئًا.
لا يشارك أي نظام ترجمة في هذا التبادل. فالنموذج الذي يحوّل وثيقة إنجليزية إلى لغة Plains Cree لا يخلق متحدثًا. وهو لا يوفر طاقمًا لفصل انغماس لغوي، ولا يدرّب معلمًا، ولا يجلس مع طفل إلى طاولة المطبخ. وإذا وُصف عملنا يومًا بأنه "ينقذ اللغات"، فهذا الوصف خاطئ وسنقول ذلك صراحة.
ما لا تستطيع الترجمة الآلية فعله
نقولها بوضوح، حتى لا يكون هناك أي لبس لاحقًا:
- لا تستطيع أن تحل محل المتحدثين. أي مخرجات لم يراجعها متحدث طليق هي مسودة وليست نصًا. وقواعد قواعد التقييم الخاصة بنا تتعامل مع كل درجة آلية كمؤشر تقريبي؛ والمراجعة البشرية وحدها هي ما يؤكد قابلية الاستخدام.
- لا تستطيع تعليم لغة أولى. يكتسب الأطفال اللغة من خلال العلاقات والانغماس، لا من خلال وثائق مترجمة.
- قد تخلق وهمًا ضارًا. عرض توضيحي "يتحدث" لغة ما قد يوحي بأن اللغة في أمان بينما هي ليست كذلك. خطر المكانة هذا حقيقي، ونتعامل معه كسؤال مفتوح يُدرس مع المجتمعات، لا كنقطة نقاش تُدار.
- لا تستطيع أن تقرر أي شيء. إن قرار وجود نظام ترجمة للغة ما، ومواضع استخدامه، هو قرار المجتمع — بما في ذلك قرار عدم نشره على الإطلاق. هذه السيطرة مدمجة في بنية نقل الملكية وسيادة البيانات، وهي تشمل السياقات: فقد يقبل مجتمع ما الترجمة الآلية للوثائق الرسمية ويرفضها للمواد التعليمية في الفصول الدراسية.
ما تستطيع الترجمة الآلية فعله بصدق
على هذه الخلفية، توجد إسهامات ملموسة ومحدودة النطاق تقدمها البنية التحتية للترجمة — وكل واحدة منها تخدم أشخاصًا يقومون بالفعل بالعمل الحقيقي.
1. زيادة الإنتاجية للمترجمين المثقلين بالأعباء. تواجه مكاتب الترجمة المجتمعية وثائق ينبغي أن توجد باللغة بعدد يفوق ما يستطيع المترجمون البشر إنتاجه من الصفر. المسودة الآلية تحوّل المهمة من "ترجمة كل شيء" إلى "المراجعة والتصحيح" — وقد وجدت دراسات مضبوطة أن التحرير اللاحق أسرع بشكل ملموس من الترجمة من الصفر، مع الحفاظ على الجودة أو تحسينها (Plitt & Masselot 2010؛ Green, Heer & Manning 2013). نصف سير العمل هذا بالتفصيل في من المعيار إلى الاستخدام اليومي. والتحفظ هنا: تلك الدراسات شملت أزواج لغات غنية بالموارد؛ ولا تتوفر لدينا بعد أدلة مكافئة بشأن اللغات متعددة التركيب، وهذا جزء مما أُنشئ هذا المشروع لقياسه.
2. أداة ضغط عملية لصالح الحقوق اللغوية. الحق في الحصول على الخدمات الحكومية بلغات الشعوب الأصلية منصوص عليه قانونًا في عدة ولايات قضائية. لكن ما يغيب غالبًا هو القدرة العملية على إنتاج الترجمات بالسرعة التي تتطلبها البيروقراطية. والمجتمع القادر على تحويل وثيقة سياسات من خمسين صفحة إلى ترجمة مُراجَعة في أيام بدلًا من أشهر يكون في موقع تفاوضي أقوى. التقنية لا تخلق الحق؛ بل تجعل تجاهله أصعب.
3. بنية تحتية لغوية قابلة لإعادة الاستخدام. المحلل الصرفي (FST) الذي نستخدمه للتحقق من أن مخرجات الترجمة تحتوي على كلمات حقيقية — لا كلمات مُختلَقة — يرمّز سبب صحة كل صيغة كلمة. وهذه الآلية نفسها هي الأساس لأدوات التعلم: مدرّبات التصريف، وأدوات الكتابة المصحِّحة للأخطاء، ومستكشفات البنية الصرفية. محرك التحقق ومحرك التعليم هما الأثر التقني نفسه. هذا مسار وليس وعدًا — فأدوات التعلم تحتاج إلى بناء، وقرار بنائها من عدمه هو قرار مجتمعي.
4. دعم متعلمي اللغة الثانية. إحياء اللغة لا يقتصر على اكتساب الأطفال لها كلغة أولى. بل يشمل أيضًا البالغين الذين يتعلمونها كلغة ثانية — أشخاصًا قد لا يصلون أبدًا إلى مستوى طلاقة كبار السن، لكنهم يستطيعون قراءة وثائق المجتمع، والمشاركة بفهم، ورفع الحضور العام للغة باستخدامها. بالنسبة لهذه الفئة، أداة الترجمة المساعدة أداة حقيقية، تمامًا كما أن القاموس أداة.
5. مبرر لتمويل العمل وامتلاكه محليًا. في نموذجنا، تُنقل الأساليب التي تثبت جدواها إلى ملكية المجتمع، وتتدفق إيرادات واجهة برمجة التطبيقات (API) في غالبيتها الساحقة إلى المجتمع (النموذج الاقتصادي). ويُدفع للمتحدثين مقابل خبرتهم، ولا يُطلب منهم التطوع بها. لا شيء من ذلك يُعد إحياءً للغة أيضًا — لكنه يوجّه الموارد نحو الأشخاص الذين يقومون بالإحياء، بدلًا من توجيهها بعيدًا عنهم.
التأطير الصادق
لهذا المجال سجل طويل من المشاريع التقنية التي تأتي حاملة سرديات الإنقاذ وتغادر حاملة المنشورات البحثية (Bird 2020). نحاول التمسك بادعاء أضيق: الترجمة الآلية بنية تحتية. والبنية التحتية تخدم أهدافًا يحددها أشخاص آخرون. الطرق لا تقرر إلى أين تسافر؛ وهذه التقنية لا تقرر ما إذا كانت اللغة ستعيش. المتحدثون والعائلات والمجتمعات هم من يقررون — وتأطير العقد الدولي للغات الشعوب الأصلية الذي أعلنته UNESCO محق في وضع الشعوب الأصلية، لا الأدوات، في المركز.
إذا خلص مجتمع ما إلى أن تقنية الترجمة تخدم أهدافه، فنريد أن تكون أفضل نسخة ممكنة وأكثرها قابلية للمساءلة — مملوكة له، ومُتحقَّقًا منها بواسطة متحدثيه، ومنشورة وفق شروطه. وإذا خلص مجتمع ما إلى أنها لا تساعده، فهذا الاستنتاج نتيجة صحيحة لهذا المشروع، لا فشلًا له. وكلا شطري هذه الجملة التزام منا.
ماذا يعني هذا لك
:::info إذا كنت فردًا من المجتمع لن يخبرك هذا المشروع بأن تطبيقًا يمكنه إنقاذ لغتك — فهو لا يستطيع ذلك. ما يقدمه محدود النطاق: ترجمة أسرع للوثائق تحت مراجعة متحدثين طلقاء، وبنية تحتية يمكن لمجتمعك امتلاكها بالكامل، وتعويض مادي مقابل خبرة المتحدثين. أما قرار استخدام أي من ذلك وكيفيته فهو قرار مجتمعك، بما في ذلك قرار عدم الاستخدام. انظر للمجتمعات اللغوية والإبلاغ عن الأخطاء وامتلاك التصحيحات. :::
:::info إذا كنت باحثًا تعامل مع "الترجمة الآلية للغات المهددة بالاندثار" كادعاء يخص البنية التحتية لا كادعاء يخص إحياء اللغة، وسيتغير سؤال التقييم لديك: ليس "هل درجة BLEU مرتفعة؟" بل "هل يقلل هذا بشكل قابل للقياس من عبء العمل على الأشخاص الذين يقومون بالعمل الحقيقي، وفق شروطهم؟" إن مواصفات المعيار وكيف يعمل §8 (التوترات والقيود) هما الموضعان اللذان نُلزم فيهما أنفسنا بهذا المعيار. :::
:::info إذا كنت مطورًا ابنِ لسير عمل التحرير اللاحق، لا للعرض التوضيحي. مستخدم أسلوبك هو متحدث طليق يصحح مسودة، وأسوأ أنماط الفشل هو كلمات مختلَقة تبدو معقولة لغير المتحدثين — ولهذا السبب يخضع كل شيء هنا لبوابة التحقق الصرفي. ابدأ بـتقديم أسلوب ومن المعيار إلى الاستخدام اليومي. :::
المصادر
- Fishman, J. A. (1991). Reversing Language Shift: Theoretical and Empirical Foundations of Assistance to Threatened Languages. Multilingual Matters.
- Hinton, L., & Hale, K. (eds.) (2001). The Green Book of Language Revitalization in Practice. Academic Press.
- Plitt, M., & Masselot, F. (2010). "A Productivity Test of Statistical Machine Translation Post-Editing in a Typical Localisation Context." The Prague Bulletin of Mathematical Linguistics, 93, 7–16. PDF
- Green, S., Heer, J., & Manning, C. D. (2013). "The Efficacy of Human Post-Editing for Language Translation." Proceedings of CHI 2013. الورقة البحثية
- Bird, S. (2020). "Decolonising Speech and Language Technology." Proceedings of COLING 2020, 3504–3519. الورقة البحثية
- UNESCO. International Decade of Indigenous Languages 2022–2032. idil2022-2032.org
انظر أيضًا
- كيف يحصل المتحدثون على أجورهم — نموذج التعويض، بالأرقام
- من المعيار إلى الاستخدام اليومي — مسار التحرير اللاحق
- كيف يعمل — البنية الكاملة للمنصة، بما في ذلك §8 حول التوترات التي لم نحسمها بعد