الانتقال إلى المحتوى الرئيسي

نموذج مُحسَّن بالضبط الدقيق (Fine-Tuned)

الفكرة: ضبط دقيق (Fine-tuning) لنموذج مفتوح الأوزان (Llama، Mistral، Gemma) على نصوص متوازية لزوج اللغات المستهدف. يتمتع بأعلى سقف جودة محتمل، لكنه يتطلب بيانات متوازية قد تكون نادرة — كما أن قواعد منع تلوث بيانات التقييم صارمة.

:::info هذا دليل إرشادي وليس تنفيذًا جاهزًا يوضح هذا الدليل المنهجية ومتطلبات البيانات والمزالق المحتملة. أما البنية التحتية الفعلية للتدريب فهي خارج نطاق منصة التقييم (harness). :::

متى تستخدم هذا النهج

  • لديك إمكانية الوصول إلى متن نصي متوازٍ (من مئات إلى آلاف أزواج الجمل) يكون مستقلًا تمامًا عن مجموعة بيانات التقييم
  • لديك إمكانية الوصول إلى وحدات معالجة رسومية (GPU) للتدريب (عتاد محلي، أو سحابة، أو عنقود حوسبة جامعي)
  • تريد أعلى سقف جودة لزوج لغات محدد وأنت مستعد للاستثمار في التدريب
  • وصلت الأساليب الأخرى (التلقين الموجَّه، التعلم بأمثلة قليلة) إلى حد ثابت في الجودة

كيف يعمل

  1. جمع البيانات المتوازية — أزواج جمل (مصدر-هدف) من مصادر مستقلة (كتب مدرسية، أرشيفات مجتمعية، سجلات Hansard، نصوص دينية، مواد تعليمية)
  2. تحضير صيغة التدريب — صيغة الضبط بالتعليمات (موجّه نظام + مدخل + مخرج متوقع)
  3. الضبط الدقيق — LoRA/QLoRA على نموذج أساسي (التكميم بدقة 4-بت يجعل ذلك ممكنًا على وحدات GPU الاستهلاكية)
  4. التقييم عبر منصة التقييم — تشغيل النموذج المُحسَّن من خلال منصة التقييم (eval harness)
  5. التكرار والتحسين — تعديل بيانات التدريب، والمعاملات الفائقة، واختيار النموذج الأساسي

متطلبات البيانات

حجم المتن النصيما يمكن توقعه
50–200 زوجتحسن طفيف مقارنة بالأداء دون أمثلة (zero-shot)؛ قد يحدث فرط تخصيص
200–1,000 زوجتحسن ملحوظ في الأسلوب والمصطلحات
1,000–5,000 زوجمكاسب جودة كبيرة لزوج اللغات المحدد
أكثر من 5,000 زوجالاقتراب من سقف الجودة للنموذج الأساسي

:::danger تلوث بيانات التقييم = الاستبعاد يجب ألا تتداخل بيانات التدريب الخاصة بك مع مجموعة بيانات التقييم. لا الجمل، ولا قائمة المفردات، ولا إعادة صياغة للمحتوى نفسه. تقوم منصة التقييم ببصم مخرجاتك؛ والتداخل الإحصائي قابل للاكتشاف. إذا لم تكن متأكدًا من استقلالية مصدر بيانات ما، فاستبعده احتياطًا. راجع قواعد لوحة المتصدرين. :::

هيكل أساسي: الضبط الدقيق باستخدام LoRA

# Conceptual skeleton — adapt to your framework (HuggingFace, Axolotl, etc.)

# 1. Format your parallel data as instruction pairs
training_data = [
{"instruction": "Translate to Plains Cree (SRO)",
"input": "The children are playing",
"output": "awâsisak mêtawêwak"},
# ... hundreds more
]

# 2. Fine-tune with LoRA (4-bit for consumer GPUs)
# Base model: meta-llama/Llama-3.1-8B, google/gemma-2-9b, etc.
# Rank: 16–64, Alpha: 32–128, Epochs: 3–5

# 3. Export and serve via the harness TranslationMethod protocol

أين تجد البيانات المتوازية

  • الأرشيفات المجتمعية — مواد تعليمية، وثائق حكومية، منشورات ثنائية اللغة
  • Nunavut Hansard — 1.3 مليون زوج محاذى بين الإنجليزية والإنكتيتوت (NRC Canada)
  • ترجمات الكتاب المقدس — متاحة للعديد من اللغات منخفضة الموارد، لكنها محصورة في مجال محدد
  • الكتب المدرسية التعليمية — غالبًا ما تكون ثنائية اللغة في سياقات تعلّم اللغات
  • أنشئ بياناتك الخاصة — راجع دليل إنشاء المتون النصية

المزايا والعيوب

✅ أعلى سقف جودة❌ يتطلب بيانات متوازية (نادرة للغات منخفضة الموارد)
✅ يتعلم النموذج الأنماط الخاصة باللغة❌ تكاليف وحدات GPU (وإن كانت LoRA تساعد في تخفيضها)
✅ يمكن أن يتفوق على أساليب التلقين❌ خطر فرط التخصيص مع مجموعات البيانات الصغيرة
✅ تكلفة تدريب لمرة واحدة، ثم استدلال منخفض التكلفة❌ قواعد صارمة لمنع تلوث بيانات التقييم

يتكامل جيدًا مع

انظر أيضًا