الانتقال إلى المحتوى الرئيسي

ما الذي يُعدّ لغةً هنا؟

ملخص تنفيذي. تُصنّف الـ Arena اللغات وفق معيار ISO 639-3، وتُقيّم اللغات الفردية (وليس مظلّات اللغات الكبرى)، وتُدرج لغات الإشارة بوصفها لغات طبيعية كما هي فعلاً، وتُدرج اللغات المُصطنعة المعترف بها من ISO، وتستبعد لغات البرمجة، وتعرض الخلافات التصنيفية دون الانحياز إلى أي طرف. تشرح هذه الصفحة كل خيار من هذه الخيارات وما يعنيه بالنسبة إلى لوحة المتصدرين.

أي مشروع يُقيّم الترجمة عبر آلاف اللغات لا بد أن يجيب عن سؤال قديم وصعب على نحو مفاجئ: ما الذي يُعدّ لغةً؟ يعرف اللغويون منذ زمن طويل أن الحدّ الفاصل بين «اللغة» و«اللهجة» مسألة اجتماعية وسياسية بقدر ما هي مسألة بنيوية — فالمقولة الشهيرة «اللغة هي لهجة لديها جيش وأسطول» انتشرت على يد اللغوي اليديشي Max Weinreich عام 1945 (وقد نسبها إلى أحد الحاضرين في إحدى محاضراته). لا يمكننا التهرب من هذا السؤال، لذا إليكم إجاباتنا، ومنطقنا في الوصول إليها.


لغات الإشارة لغات. نقطة على السطر.

لغات الإشارة لغات طبيعية — بقواعد نحوية كاملة، يكتسبها الأطفال اكتساباً فطرياً، ولها مجتمعات لغوية حيّة. هذه مسألة محسومة في علم اللغة منذ أن أثبت William Stokoe عام 1960 أن لغة الإشارة الأمريكية تمتلك النوع نفسه من البنية الداخلية الذي تمتلكه اللغات المنطوقة، ولم تزدها ستون عاماً من البحث منذ ذلك الحين (Klima & Bellugi 1979؛ Sandler & Lillo-Martin 2006) إلا ترسيخاً. يخصّص معيار ISO 639-3 رموزاً لغوية فردية للغات الإشارة؛ ويُصنّفها Glottolog إلى جانب العائلات اللغوية المنطوقة. يضم فهرسنا أكثر من 160 لغة منها، موسومة بـ modality: signed.

بعضها لغات أصلانية مهددة بالانقراض: لغة الإشارة لهنود السهول (psd)، التي كانت تاريخياً لغة تواصل مشتركة رئيسية بين القبائل في أنحاء أمريكا الشمالية، باتت اليوم مهددة بالانقراض بشدة (Davis 2010، Hand Talk). إن تهديد لغات الإشارة بالانقراض هو تهديد للغات الشعوب الأصلية بالانقراض، وهو يقع في صميم مهمة هذا المشروع.

ملاحظة صريحة حول النطاق. تُقيّم الـ Arena حالياً الترجمة الآلية النصية. أما الترجمة الآلية للغات الإشارة — التي تتعامل مع الفيديو، والقواعد المكانية، ولغات ليس لها صيغة مكتوبة واسعة الانتشار — فهي مشكلة تقنية مختلفة لم تُحلّ بعد إلى حد كبير (انظر Yin et al. 2021, "Including Signed Languages in Natural Language Processing," ACL). نحن لا نخدمها بعد. ومدخلات لغات الإشارة في فهرسنا تقول ذلك بالضبط: غير مخدومة بعد — وليست أبداً «ليست لغة».

هناك نمطان للغة. والكتابة ليست أحدهما.

تأتي اللغات في نمطين أساسيين: منطوق ومُشار به. الكتابة ليست نمطاً ثالثاً — بل هي تقنية تُضاف فوق اللغة، ومعظم لغات العالم تستغني عن كتابة موحّدة. لهذا السبب تتتبّع بطاقات اللغات لدينا الكتابة بشكل منفصل (أي الخطوط التي تستخدمها اللغة، أو ما إذا كانت تفتقر إلى إملاء موحّد أصلاً) وتتتبّعها بصدق: فبالنسبة إلى منصة ترجمة آلية نصية، يُعدّ كون اللغة مكتوبة أم لا معلومة بالغة الأهمية، وليس مجرد هامش — واللغة غير المكتوبة ليست لغة أدنى مرتبة.

اللغات المُصطنعة: مقبولة. لغات البرمجة: مستبعدة.

نتّبع الخط الذي رسمه معيار ISO 639-3 نفسه. فالمعيار لا يقبل لغة مُصطنعة إلا إذا كانت لغة كاملة، صُمّمت للتواصل البشري، ولها أدب ومجتمع نقلها إلى جيل ثانٍ من المستخدمين — وهو يستبعد صراحةً لغات البرمجة الحاسوبية. لغة Esperanto، بمتحدثيها الأصليين، تستوفي الشرط؛ أما Python فلا، لأن أحداً لا يكتسب Python لغةً أولى من والديه. يضم فهرسنا اللغات المُصطنعة الأربع والعشرين التي يعترف بها ISO، مُصنَّفة على هذا النحو، ولا يضم أي لغة برمجة.

نُقيّم اللغات الفردية، لا المظلّات

يميّز معيار ISO 639-3 بين اللغات الفردية واللغات الكبرى — وهي رموز مظلّية مثل cre (Cree) أو ara (Arabic) أو zho (Chinese) تغطي عدة لغات فردية وثيقة القرابة. وحدة التقييم في الـ Arena هي اللغة الفردية، لسبب عملياتي: موارد الترجمة خاصة بكل صنف لغوي على حدة. فمُحلّل صرفي بُني للغة Plains Cree (crk) لا يُولّد لغة Moose Cree (crm)؛ ومُدوّنة من العربية المصرية لا تقول شيئاً يُذكر عن جودة طريقة ما في العربية المغربية. والدرجة المرتبطة برمز مظلّي ستكون ادعاءً بشأن أصناف لم تُقيَّم فعلياً قط — لذلك لا نفعل ذلك.

تظل اللغات الكبرى حاضرة في الفهرس بوصفها صفحات محورية: أي تصفّح يربط الهوية المظلّية بأعضائها الفرديين، بما يعكس ملاحظة ISO نفسها بأن كلا مستويي الهوية حقيقي. وتحت مستوى اللغة الفردية، نعرض معلومات اللهجات والنسب من شجرة الكيانات اللغوية في Glottolog (Hammarström & Forkel 2022)، التي تُمثّل العائلات واللغات واللهجات في تسلسل هرمي واحد قابل للتصفح.

عندما تختلف الجهات المرجعية، نعرض الموقفين معاً

يختلف ISO 639-3 وGlottolog أحياناً في التقسيم أو الدمج، وقد تختلف المجتمعات اللغوية مع كليهما. نحن لا نحكم بينهما. تحمل بطاقات اللغات خاصية ملاحظات تصنيفية تعرض الخلاف مع المصادر، وتتّبع التسمية رأي المجتمع اللغوي حيثما عبّر المجتمع عن تفضيل معين. فمسألة ما إذا كان صنف لغوي ما «لغة» هي، في نهاية المطاف، مسألة هوية جزئياً — ومسائل الهوية تخص المجتمعات نفسها، وهو مبدأ نتبنّاه من أطر حوكمة بيانات الشعوب الأصلية مثل OCAP®.

اتجاه بحثي: التقييمات المعيارية كأداة قياس

أحد الأشياء التي تنتجها ساحة كهذه، شبه عرضياً، هو نوع جديد من الأدلة حول مدى التقارب الفعلي بين الأصناف اللغوية من الناحية العملياتية. فإذا خدمت طريقة ترجمة واحدة، مثبَّتة دون تغيير، عدة أصناف متقاربة بجودة قابلة للنشر، فإن تلك الأصناف تتجمّع عملياً في عنقود واحد؛ وإذا تطلّبت مدوّنات منفصلة وطرقاً منفصلة، فهي متمايزة عملياتياً — أياً كان ما تقوله سياسات التسمية. وهذا يشبه تقاليد تجريبية أقدم، من اختبارات الفهم المتبادل عبر النصوص المسجلة إلى مقاييس المسافة المعجمية المؤتمتة، مع لمسة قائمة على واقع النشر الفعلي.

نقدّم هذا بحذر، بوصفه اتجاهاً بحثياً لا ادعاءً. فنتائج انتقال الطرق تتداخل فيها عوامل مُربكة مثل حجم المدوّنة، والمجال، والإملاء، وتلوّث بيانات التدريب، والتعنقد يكون دائماً نسبياً إلى طريقة معينة وعتبة جودة معينة. وفوق كل ذلك: يمكن لهذه الإشارة أن تُثري النقاشات حول اللغة واللهجة، لكنها لا تتجاوز أبداً الطريقة التي يُعرّف بها المجتمع لغته الخاصة.


المراجع

  • Davis, Jeffrey E. (2010). Hand Talk: Sign Language among American Indian Nations. Cambridge University Press.
  • Dryer, Matthew S. & Martin Haspelmath, eds. (2013). The World Atlas of Language Structures Online. https://wals.info
  • Hammarström, Harald & Robert Forkel (2022). "Glottocodes: Identifiers Linking Families, Languages and Dialects to Comprehensive Reference Information." Semantic Web 13(6).
  • Haugen, Einar (1966). "Dialect, Language, Nation." American Anthropologist 68(4).
  • ISO 639-3 Registration Authority. "Scope of denotation" and "Types of individual languages." https://iso639-3.sil.org/about/scope · https://iso639-3.sil.org/about/types
  • Klima, Edward S. & Ursula Bellugi (1979). The Signs of Language. Harvard University Press.
  • Sandler, Wendy & Diane Lillo-Martin (2006). Sign Language and Linguistic Universals. Cambridge University Press.
  • Stokoe, William C. (1960). Sign Language Structure. Studies in Linguistics, Occasional Papers 8.
  • Weinreich, Max (1945). "Der YIVO un di problemen fun undzer tsayt." YIVO Bleter 25(1).
  • Yin, Kayo, Amit Moryossef, Julie Hochgesang, Yoav Goldberg & Malihe Alikhani (2021). "Including Signed Languages in Natural Language Processing." Proc. ACL-IJCNLP 2021. https://aclanthology.org/2021.acl-long.570/
  • First Nations Information Governance Centre. The First Nations Principles of OCAP®. https://fnigc.ca/ocap-training/