عبد الهادي سعودي1 وفيوليطا كفالي سفورزا 2
1 مركز اللغات والإتصال، المدرسة الوطنية للصناعة المنجمية.
شارع الحاج أحمد شركاوي، ص ب 753 أغدال، الرباط، المغرب
الهاتف : 212 37 68 02 31 الفاكس : 212 37 77 10 55
assoudi@enim.ac.ma
2 جامعة سان فرانسيسكو، قسم علم الحاسوب،
1600 شارع هولواي، سان فرانسيسكو ، CA 94132
الهاتف: 415/338-1008الفاكس: 415/338-6826
mailto:vcs@sfsu.edu vcs@sfsu.edu
الـمـسـتـخـلص
نقوم من خلال هذه الورقة بتقديم النموذج الإحصائي الخاص بتوليد الصرف في اللغة العربية على مرحلتين رئيسيتين وهذا بتمييز التغيرات التي تتم بزيادة حروف في وسط الفعل في الجذر العربي من خلال بوادئ ولواحق الكلمات والأفعال. يرتكز هذا النموذج على الفروق والاختلافات الشجرية وقواعد التحويلات؛ فعند التفريق، في إشكالية تغيرات الجذر، من خلال البادئة واللاحقة من شأنه تقليص، وبشكل معتبر، عدد قواعد التحويلات المطلوب إجراؤها وهذا ما يسمح لمولد اللغة العربية أن يكون أكثر صغرا وأكثر بساطة وسهولة في الاستعمال.
يمنح لنا الإطار الصرفي القائم على اللفظLexeme Based Morphology Framework [1, 2] الدعامة النظرية للتمثيل الذي نحن بصدده في قواعد الصرف في اللغة العربية والذي يرتكز على الجذور، عكس مقاربة "طرق الجذر + النموذج + اللفظ" المتبعة من قبل العديد من الباحثين. لقد استعملنا المُشَكِّلْ MORPHE [11] مصنف القاعدة الصرفية وذلك لدمج المصادر اللغوية؛ كما تم اختبار هذه الأداة على مجموعات فرعية لأفعال مصرفة تحتوي على أفعال مجوفة ومجموعة أخرى متنوعة من الأفعال والأسماء المشددة والمخففة والمتضمنة لأسماء في صيغة نماذج جمع التكسير والأسماء المصوتة. نركز في هذه الدراسة على صرف وإعراب الفعل كما تتناول كذلك آفاق الاستعمال الواسع لهذه المنهجية.
¹ الـكـلمات الـدالـة :
المعالجة الصرفية للغة العربية؛ البناء الصرفي؛ التوليد.
1. الـمـقـدمــة :
يعتبر صرف اللغة العربية نظام غير تسلسلي، يتوقف أساسا على معالجة جذور الحروف والكلمات بطريقة غير تسلسليةّ؛ وهذا باستعمال مختلف العمليات كـزيادة الحروف في وسط الكلمات ومضاعفتها (حروف العلة). إن نوع الإحصاء الصرفي للغة العربية والمقبول والمعتمد من قبل اللغويين هو ذلك الذي اقترحه ماك كارتي McCarthy [13]؛ والذي مفاده أن الجذور تتشكل من الارتباطات الاشتقاقية لجذر الكلمة Morphème ولحن الحركة اللذين يتم جمعهما وفقا لنموذج قاعدي (قانوني). يندمج الجذرroot مع النموذج ليشكل في النهاية شكل الكتابة أو جذر الكلمة stem (الرسم)؛ فعلى سبيل المثال في الشكل التالي "كتب" kataba تتركب من الحروف ك، ت، ب ktb لتشكل "مفهوم الكتابة" بإضافة الحركات "الفتحة" a a وهكذا تندمج الحروف والحركات على حسب الكلمة المراد تشكيلها وفقا للقاعدة والنموذج التالي: CVCVC (C=consonant, V=vowel) (أي الحرف والحركة). تحاول جل العمليات الإحصائية الصرفية تجسيم صرف اللغة العربية؛ والتي نجدها في أعمال الكثير من المختصين في الميدان، ونذكر على سبيل المثال لا الحصر: نموذج الحالة المتناهية غير التسلسلية لـ كاي Kay (Kay’s non-concatenative Finite State model[8] ونموذج متعدد التثبيت (التسجيل) ذو المستويين لـ كيراز Kiraz Kiraz’s Multi-TapeTow- Level model[9] ونموذج المستويين لـ بيسليBeesly Beesly’s Tow-Level model [3, 4, 5] كل هذه النماذج تعكس انفصال المستويات الذي تم ذكره سابقا عند ماكارتي (المرجع نفسه).
تتقيد دراستنا الإحصائية هذه والخاصة بقواعد الصرف في اللغة العربية بمقدمات المعجم الصرفي (LBM) القائم على المطلب الذي مفاده أن الجذر هو الشكل الإعرابي الوحيد للمعجم (LEXEME) وهي العبارة المعجمية المنتمية للمجموعات المعجمية التركيبية للفعل والاسم والصفة والحال؛ كما أنه يعتبر تمثيل غاية في التعقيد، يعمل على ربط المعنى مع مجموعة المفردات النحوية المرتبطة بها مع أشكال الكلمات الموافقة لها. ففي نموذج LBM تعتبر المعجميات (LEXEME والحروف المستقلة العناصر النحوية الدنيا. إن تصريف الأفعال أو اشتقاق الألفاظ – البوادئ واللواحق والمضاعفة (التشديد) وزيادة الحروف المزيدة وسط الكلمات – ليست عناصر نحوية في حد ذاتها وإنما هي عبارة عن عبارات صوتية للعمليات التي تجسد وتطبق العناصر النحوية القاعدية. إن الجذر ومختلف العمليات التي تحدث عليه يصبح مركز التمثيل وهذا ما يجعل منهجيتنا تختلف عن الطرق والمناهج السابقة في مجال التمثيلات الإحصائية لقواعد الصرف في اللغة العربية (مثال: [3, 4, 5]، [9])؛ تمنح هذه المنهجية وضعية متساوية لكل العناصر المركبة للكلمة العربية (الجذر والنموذج والتصويت) وذلك بوضعها في معاجم منفصلة، وللتفصيل أكثر حول هذه الطريقة والمناهج الأخرى التي تعتني وتهتم بقواعد الصرف في اللغة العربية يمكن الرجوع إلى المراجع المذكورة في البيبليوغرافيا [18].
2. قـواعـد صـرف الـفـعل فـي اللـغـة الـعربـية :
إن التنوع والغنى في أشكال رسم الفعل العربي بقدر ما يمثل ميزة لها بقدر ما يمثل كذلك إشكالا عويصا ومربكا في كثير من الأحيان لكل من ٌيقبل على دراسة اللغة العربية. ُيعرب الفعل العربي طبقا لأحدى النماذج التقليدية المعروفة؛ حيث أن هناك خمسة عشر مصدرا ثلاثيا، تسعة منها مشتركة تتميز بفروق طفيفة فيما بينها ويمكن إيجاد ضمن كل صرف/ نموذج نمط كلي: صيغتين (الفعل التام والفعل الناقص) وصيغتين (المبني للمعلوم والمبني للمجهول) وخمس صيغ للفعل (الدال والشرطي وصيغة الأمر وصيغة الناشط ENERGITIC) بالإضافة إلى زيادة البوادئ واللواحق وعمليات الإعراب والاشتقاق التي يمكن أن تُحدث تغييرا في شكل الكلمة بإضافة حروف زائدة في وسط الكلمة (حروف العلة) وهذا في وجود مختلف الملامح البنيوية والإعرابية مثل بعض الحروف. يمكن تصنيف جذور الأفعال العربية كما هو مبين في (الشكل رقم 1). الفرق الأولي الذي يمكن ملاحظته هو بين الأفعال المشددة والأفعال المخففة strong & weak verbs؛ فالأفعال المخففة هي تلك الأفعال التي لها حروف مخففة (w or y) واحد أو أكثر من هذه الحروف في جذوره، أما الفعل المشدد هو ذلك الفعل الذي لا يحتوي على الجذور المخففة.
تحتمل الأفعال المشددة تغييرات على مستوى الحركات من الفعل التام إلى الفعل الناقص؛ حيث تختفي الحركة الأولى في الفعل الناقص. أما الأفعال التي لها حركة في منتصف الجذر في الفعل التام "الفتحة" «a » تتحول إلى نفس الحركة « a » : "قطع يقطع "Qata a Yaqta u ، إلى الكسرة « i » ضرب يضرب Daraba Yadibu، أو إلى الضمة « u » كتب يكتب Kataba Yatubu في الفعل الناقص.
لا يمكن للأفعال المبنية على الكسرة في منتصف الجذر في الفعل التام أن تتحول إلا نحو "الفتحة" « a » (مثال: شرب يشرب) (shariba Yashrabu) أو إلى الكسرة « i » (مثال: حسب يحسب) (Hasiba YaHsibu).
الأفعال المنية على الضمة في منتصف الجذر في الفعل التام لا يتحول إلى الفعل الناقص (مثال: حسن يحسن) (Hasuna YaHsunu)، أما في الأفعال المشددة فإنه لا يوجد هناك تغير لا في الفعل التام ولا في الفعل الناقص في رسم شكل الأفعال لا في الجنس ولا العدد.
الأفعال المجوفة هي تلك الأفعال التي تضم في منتصف جذرها التخفيف؛ ففي زمن الفعل التام والفعل الناقص يمكن تجسيدهما برسمين احدهما طويل والآخر قصير؛ ذلك أن استعمالها يرتبط بالجنس والعدد.
تنقسم الأفعال المجوفة إلى أربع مجموعات وهي :
1. أفعال النموذج التالي : CawaC (حرف حركة حرف) والذي له نماذج الجذر التام CuC (حرف ضمة حرف) وكذا CuuC (حرف ضمة مشددة (مد) حرف) وكذا نماذج الجذر الناقص CuC (حرف ضمة حرف) و CuuC (حرف ضمة مشددة). مثال الفعل زار zaara المشتق من زيارة zawara وفعله التام زر zur وجذور الفعل الناقص زر و زور zur zuur. مثال على ذلك زرت (فعل ماضي) ويزور (فعل مضارع).
2. أفعال النموذج التالي: CawiC (حرف فتحة ضمة حرف) و الذي له نماذج الجذر التام CiC (حرف كسرة حرف) و CaaC (حرف فتحة مشددة) وكذا نماذج الجذر الناقص CaC (حرف فتحة حرف) وCaaC (حرف فتحة مشددة (مد) حرف). مثال على ذلك الفعل نام naama المشتق من النوم nawima له جذور الفعل التام نم nim ونام naama وجذور الفعل الناقص نم ونام nam & naam . مثال نام naama وينمن yanamana.
3. أفعال النموذج التالي: CayaC (حرف فتحة مخففة حرف) والذي له نماذج الجذر التام CiC (حرف كسرة حرف) و CaaC (حرف فتحة ممددة حرف) ونماذج جذر الفعل الناقص CiC (حرف كسرة حرف) و CiiC (حرف كسرة ممدة حرف). مثال باع المشتق من البيع baa’a من baya’a له جذور الفعل التام بع bi و باع baa وجذور الفعل الناقص بع وبيع bi & bii.
4. أفعال النموذج التالي : CayiC (حرف فتحة حرف كسرة حرف) والذي له نماذج الجذر التام CiC & CaaC وهي (حرف كسرة حرف) و (حرف فتحة ممدة حرف) على التوالي وكذا نماذج جذر الفعل الناقص CaC & CaaC وهي (حرف فتحة حرف) وحرف فتحة ممدة حرف) على التوالي. مثال الفعل هاب haaba المشتق من المصدر هيبة hayiba له جذور الفعل التام هب hib وهاب haab وجذور الفعل الناقص هاب hab وهاب haab .
تبين الدراسات ذات العلاقة بالموضوع [3,4,5,9] أن كل الأفعال المنتمية إلى المجموعات السابقة تفترض أن النموذج التي تبنى عليه هو: CVCVC (حرف حركة حرف حركة حرف) وهذا الأخير لا يبين المجموعة الإعرابية والصرفية للفعل المعرب وهذا ما يخلق صعوبة في التنبؤ بنوع الجذر المستعمل. ولتجنب هذه المشاكل نعمل على إبقاء المعلومة في منتصف الجذر وإبقاء الحركة على مستوى قاعدة رسم الفعل. عند عملية التوليد الصرفي يمكن استعمال ومعالجة المجموعتين 2 و 4ضمن مجموعة واحدة لأن لهما نفس جذور الفعل التام والفعل الناقص.
سنعمل خلال ما سيأتي من هذه الدراسة على تقديم أداة المشكل Morphe tool ووصف منهجية التجسيم للأفعال المشددة والأفعال المجوفة.
3. الـنـظام الـقاعـدي للـمـشـكّل (MORPHE) :
MORPHE [11] هو عبارة عن مشكّل للقواعد المرفولوجية مكتوب بلغة Common Lisp ؛ حيث يتم على مستواه وصف صوت ونطق اللغة باستعمال نوعين من البنية التركيبية؛ تتمثل الأولى في الشكل الهرمي الصوتي وتتمثل الثانية في مجموعة من القواعد التحويلية المرتبطة بصفة عقدة الهرم الصوتي. يقوم المشكل بوضع هذا الوصف إما ضمن برنامج توليد الكلمة أو ضمن برنامج إعراب الكلمة؛ فالمولد الصرفي يأخذ بعين الاعتبار الملمح البنيوي (FS) Feature Structure ضمن المدخلات وقائمة البنية، حيث تمثل عناصرها أزواج ملامح القيمة Feature-value Pairs (FVP، يمكن لجزء القيمة لـ (FVP) أن تكون دقيقة أو تكون الملمح البنيوي (FS) في حد ذاته وذلك بجعلها بنية تكرارية. فعلى سبيل المثال عندما يقوم الملمح البنيوي بتوليد الفعل العربي زرت zurtu تكون العملية على الشكل التالي :
(الجذر زيار، المجموعة: v، زمن الفعل أو صيغته: فعل تام، الصيغة: دال، الصيغة: مبني للمعلوم، العدد: مفرد، الضمير: الأول).
إن اختيار ملمح الأسماء والقيم ما عدا الجذر المحدد للموضوع النحوي والمعجمي المراد تحويله هو في حد ذاته الغاية والهدف الذي يبتغيه المستعمل. تأتي أزواج ملامح القيمة FVP ضمن الملمح البنيوي FS من مصدرين وهما: الملامح الساكنة مثل المجموعة cat (جزء من الكلام) والجذر ومن المعجم البنائي الذي يحتوي، بالإضافة إلى الرسم (الشكل) القاعدي للكلمات، يحتوي كذلك على الملامح المعجمية والصرفية ويتمثل المصدر الثاني في الملامح الديناميكية (الحركية) مثل زمن الفعل والعدد؛
كما تم وضعه من قبل مستدعي المشكل ضمن سياق نظام آلة الترجمة وهو ما يمثل بكل بساطة تركيب التوليد المعجمي، أما مخرجات المولد الصرفي فإنها تتمثل في صف وترتيب الحروف داخل الكلمة.
1.3 الشكل الهرمي الصرفي (MFH) :
يعمل الشكل الهرمي الصرفي على تنظيم القواعد التحويلية المتعلقة بقيم الملامح في الملامح البنيوية FS كما يعمل كشبكة تمييزية لاسترجاع القواعد المناسبة المولدة للملامح البنيوية FS. تميز كل عقدة داخلية في الشجرة جزء من الملامح البنائية المشتركة للشجرة الفرعية الكاملة. يعمل جذر الشجرة والتي هي عقدة خاصة ¤جذر¤ على ربط كل الأشجار الفرعية فيما بينها. توافق عقد الأوراق الأشكال الصرفية المميزة في اللغة وتكون كل عقدة في الشجرة تحت الجذر مبنية عن طريق الشكل الصرفي الذي تٌحدد العقدة الأم والارتباط المنطقي لـ FVP التي تميز العقدة البنت من العقدة الأم والعقد الإخوة. فعلى سبيل المثال في الشكل الصرفي التالي:
(morph-form v-stem-f1-act-perf-1/2 v-stem-f1-act-perf (person or 1 2)))
يبين لنا أن العقدة v-stem-f1-act-perf-1/2 هي ابنة العقدة v-stem-f1-act-perf كما تضيف معلومة ملح الشخص (person) يجب أن يأخذ القيمتين إما 1 أو 2.
.2.3 القواعد التحويلية :
تؤثر القاعدة المرتبطة بكل عقدة ورقة على التحويلات الصرفية المرغوب فيها لتلك العقدة؛ حيث تشتمل العقدة على واحدة أو أكثر من الشروط المتبادلة بصفة إقصائية؛ فجزء "إذا" « if » من الشرط هو نموذج تعبيري منتظم يُربط مقابل قيمة خاصية الجذر (a string)، أما جزء "إذن" « Then » فإنه يحتوي على واحد أو أكثر من المعاملات المطبقة في ذلك الترتيب وتضم هذه المعاملات الجمع والحذف وإبدال البوادئ واللواحق وزيادة الحروف الوسطية (حروف العلة). تتمثل مخرجات التحويلات في تحويل وتر الجذر (ترتيب الحروف في الجذر)، كما تمثل القاعدة التحويلية المنتجة للكلمة " زر " « zur » جزء من الكلمة العربية "زرت" « zurtu »، حيث تتمثل فيما يلي:
(1)
(morph-rule v-stem-f1-act-perf-1/2
(“^%(cons) (awa) % (cons)$”
(ri ¤1¤ « u »))
لهذه القاعدة الاختبار التالي: (“^%(cons) (awa) % (cons)$” فكلا من الرمزين "^" و "$" يدلان على بداية ونهاية صف الحروف على التوالي؛ أما الرمز {} فإنه يُستعمل للدلالة على المتغيرات مع مجموع هذه القيم؛ فعلى سبيل المثال تمثل البنية "(cons)" في القاعدة السابقة ربط أي حرف معرف لأي من القيم المحتملة للمتغير "(cons)" (=consonant) والأوتار الموضوعة بين المزدوجتين في "جزء إذا" « if part » من القاعدة (مثال ذلك الاختبار) يشير إلى التسجيلات التي يمكن للمشكّل الوصول إليها في "جزء إذن" « Then part » من القاعدة وبعدها يتم تعداد وحساب هذه التسجيلات؛ بحيث يمكن للمشكل morphe أن يصل إلى تسع تسجيلات، ففي الحالة التي أمامنا هناك تسجيل واحد فقط يحيل أو يشير إلى "جزء إذن" من القاعدة كـ¤1¤. "RI" يكون بديلا للحرف المزيد (INFIXE) ويعوض المعامل ليكون بديلا للدليل الأول مع الدليل الثاني لمدخلات صف الكلمات (الجذر) وهذا يعني أنه يكون بديلا للوتر (awa) مع حركة الضمة "u". إن تطبيق هذه القاعدة في مدخلات "zawar" يُنتج الشكل الكتابي "zur".
.3.3 المسار المنطقي والأشكال المنتظمة :
هناك افتراض مفاده أنه ليس كل تصريف وإعراب في اللغة العربية هو تصريف منتظم، ومن هنا يعمل المشكل Morphe على تحمل الأشكال غير المنتظمة كجزء من مسارها المنطقي. عند عملية التوليد ٌتربط الخصائص البنيوية مقابل الخصائص المحددة لكل شجرة فرعية للشكل الهرمي الصرفي MFH إلى غاية الوصول إلى عقدة الورقة، وبهذا يقوم المولد بفحص الأشكال المعجمية غير المنتظمة للمدخل المكشف بقيمة خاصية الجذر واسم العقدة وإرجاعها في حالة وجود مدخل لها، من جهة أخرى يحاول المشكّل تطبيق القاعدة التحويلية المرتبطة بعقدة الورقة ، وفي حالة عدم وجود قاعدة تحويلية أو شرط يناسب قيمة الجذر تصبح قيمة خاصية الجذر غير قابلة للتغيير.
4. تـصريـف الـفعل العربـي، الـتولـيد في الـمشكل Morphe :
كما تم توضيحه في منهجيتنا سابقا سنقوم الآن بمناقشة حالة الأفعال المجوفة، حيث تم إعطاء خصائصها في القسم الثاني من هذه الدراسة والتي بينا فيها كذلك كيف أدمجنا معالجتها مع أكثر الأفعال المنتظمة، كما سنتناول كيف بإمكان مد وتوسيع هذه المنهجية لتشمل المجموعات الأخرى من الأفعال وأجزاء أخرى من الكلام.
ٌيؤكد من خلال الاستعمال المألوف والمتفق عليه مع القواعد المقررة في الرسم والشكل أن التحويلات الصرفية الضرورية لقيمة خاصية جذر الكلمة أنه يٌمكن تحديده بقاعدة واحدة مرتبطة بعقدة المصراع للشكل الهرمي، وهذا الافتراض ما يدعم هنا اللغة العربية؛ إذ يعمل على إظهار الشكل الهرمي الصرفي MFH بأكثر كثافة ويتم وضع قاعدة حيث يتم تكرار نفس العمليات التحويلية في قواعد متعددة. يمثل مصدر التكرار نظام الفعل في اللغة العربية نفسه؛ بحيث يمكن لجذور الأفعال أن تختلف في صيغتي المبني للمعلوم والمبني للمجهول وفي صيغ الفعل التام والفعل الناقص وتتوقف هذه التغييرات على شكل الفعل؛ فعلى سبيل المثال الأفعال المجوفة لنفس الصيغة والزمن المصرف فيه يتغير فيها الجذر ثلاثة عشر احتمالا للارتباطات المحتملة بين العناصر التالية: الشخص - الجنس - العدد. في المقابل فإن البوادئ واللواحق المشتركة والمرتبطة بكل ارتباط "الشخص - الجنس – العدد" تبقى مستقرة نسبيا في كل أنواع الأفعال الأخرى مع تبيان بعض حدود الاحتكاك مع الأفعال المخففة.
إن استعمالنا للمشكّل Morphe لتمثيل تصريف الفعل العربي بين لنا أنه بإمكاننا تقليص، وبطريقة فعلية، عدد تكرارات القواعد التحويلية بفصل جذر التحويلات وتغييرات البادئة/ اللاحقة ([6,15]). حصص MFH للغة العربية مبينة في (الشكل رقم1). بما أن Morphe يتحمل MFH واحدة فقط عملنا على خلق شجرتين فرعيتين تحت الشجرة الفرعية للفعل، حيث عقدة جذره مبينة في (الشكل رقم 2) بواسطة FVP (cat v) التي تحتوي إحدى الشجرتين الفرعيتين والمبينة بواسطة FVP (chg stem)(مثال: مولد الجذر)، على قواعد لتغييرات الجذر؛ أما الشجرة الفرعية الأخرى والموضحة بواسطة FVP (chg psfix) تحوي قواعد للإضافات البادئة واللاحقة. يتم استدعاء المولد الصرفي مرتين؛ المرة الأولى لإرجاع الجذر المعدل؛ حيث يٌستبدل كقيمة لخاصية الجذر قبل الاستدعاء الثاني الذي يهتم بالبوادئ واللواحق؛ فعلى سبيل المثال الفعل زرت zurtu حيث الاستدعاء الأول يعمل على إيجاد وتطبيق القاعدة التحويلية المبينة في القسم 3.2 في الأعلى؛ أما الاستدعاء الثاني فإنه يعمل على إيجاد وتطبيق القاعدة : (morph-rule v-psfix-perf-1-sg ("" (+s "tu")))
الذي يعمل على إضافة اللاحقة "tu".
يوضح (الشكل رقم 1) أوجها أخرى من تمثيل قواعد الصرف في اللغة العربية؛ فالمعلومة التي نحتفظ بها في معجم الأفعال المتضمنة للجذر (المعطاة كقيمة لخاصية الجذر للفعل زار zawar) وكذا شكل الفعل (مثال الشكل 1)) يمكنها أن تغير الحركة حيث يتطلب ذلك، أما بالنسبة للأفعال المجوفة فإن الجذر الوسطي (w or y) وحركتها في خاصية الجذر هو الذي ٌيحدد التحويلات المطلوبة للجذر في الفعل التام والفعل الناقص، فعند فصل تغييرات الجذر عنها في التغيرات التي تحدث على مستوى البوادئ واللواحق البادئة/اللاحقة لمختلف أنواع التغييرات التي تحدث على مستوى الجذر.
بينما في MFH الحالي فإن كل العقد تُعطي اسما (ما يفترض من الناحية المثالية أن واحدة تعكس مسار خاصية القيمة المستعملة للوصول إليها). الشكل أعلاه لا يبين إلا العقد "أزواج خاصية القيمة المميزة".
لا يحدث أي تغيير للجذر في الأفعال المنتظمة المشددة وفي الفعل التام في صيغة المبني للمعلوم؛ من جهة أخرى تستعمل الأفعال المجوفة جذر طويل ووسط طويل؟ اليف alif (مثال مد طويلa طويل مثال دام daam) لضمير المفرد الغائب وثنائي (مذكر ومؤنث) وضمير الجمع الغائب المذكر السالم كما هو موضح في (الشكل 2)، أما باقي الارتباطات ضمير (شخص) - العدد - الجنس فإن لها جذر قصير وحركتها تتوقف على جذر الفعل المبطئ، كما تم تبيانه سابقا. تجري القواعد التحويلية المرتبطة بعقدة المصراع تحويلات لقيمة خاصية الجذر للجذر الطويل والجذر القصير. إن إمكانية تساوي العقد يتم الحصول عليه بواسطة مختلف المسارات في MFH (مثال : مختلف تعاقبات FVP ) الذي من شأنه أن يقلص عدد القواعد المطلوبة لمعالجة الأفعال المجوفة؛ وهذا يعني أن كلتي عقدتي الورقتين والتي لها جذر قصير بإمكانهما أن تكونا متساويتين؛ لذلك تعالج بقاعدة واحدة. هناك قاعدة أخرى ضرورية لمعالجة الجذر الطويل لعقدتي الورقتين الأخرتين. ولإعطاء شرح وتوضيح أكثر للوصف السابق نعطي الأمثلة التالية :
I. مثال عن الفعل الأجوف :
المداخلات : البنية الخصائصية : ((الجذر "زار" ) (صيغة المبني للمعلوم) (الضمير (¤أو¤ 1 2 )) (الشكل 1) (صيغة الفعل التام)
في الاستدعاء الأول للمشكل MORPHE (تغيير الجذر) (chg stem) (مثال v-stem-f1-act-perf-12) يتم اجتياز الشجرة الفرعية السابقة ويتحول بذلك الجذر زر zur.
(2)
(morph-rule v-stem-f1-act-perf-1/2
("^%{cons}(awa)%{cons}$"
(ri *1* "u"))
فعندما يتم استدعاء المشكل للمرة الثانية فإن شجرة تغييرات البادئة/اللاحقة يتم اجتيازها إلى غاية الوصول إلى العقدة v-psfix-perf-f1-sg وهنا يطبق المشكل القاعدة المرتبطة بهذه العقدة؛ أي:
(3)
(“”
(+ “tu”).
تضيف هذه القاعدة اللاحقة "tu" للجذر "nim"؛ حيث يقوم المشكّل بإرجاع الكل للحصول على الفعل « nimtu »، للتذكير فإن اختبار هذه القاعدة لاغ، كما هو مبين في الاقتباس “” (يُطبق في كل الحالات).
II. مثال عن الفعل المشدد :
المدخلات : البنية الخصائصية: ((الجذر "كتب" ) (صيغة المبني للمعلوم) (الضمير (¤أو¤ 1 2 )) (الشكل 1) (صيغة الفعل التام)
عند الاستدعاء الأول للمشكل فإن (تغيير الجذر) (chg stem) (v-stem-f1-act-perf-12) يقوم باجتياز الشجرة الفرعية، في هذه الحالة يحاول MORPHE تطبيق القاعدة في (2) السابق ولكنه يفشل بسبب السلسلة (الصف) (كتب) (katab) الذي لا يربط التعبير المنتظم ‘’^(cons)%(cons)$’’ (اختبار غير مرضي للقاعدة المراد تطبيقها). يقوم المشكل بتحويل قيمة خاصية الجذر وإرجاعها غير قابلة للتغيير؛ فإذا تم استدعاء المشكّل مرة أخرى يعمل(chg strem) باجتياز الشجرة الفرعية إلى غاية الوصول إلى العقدة v-psfix-perf-f1-sg؛ وبالتالي يعمل المشكّل على تطبيق القاعدة في (3) السابقة بحيث تثبت اللاحقة "tu" في الفعل كتب (katab) وتصبح بالتالي النتيجة كتبتُ katabtu.
5. الـتـمديـد (الإضـافـات) :
لقد تم التركيز في هذه الدراسة على نوعين من الأفعال في اللغة العربية وهما الأفعال المنتظمة والأفعال المجوفة (المعتل الوسط) وفقا للنموذج (حرف حركة حرف حركة حرف) (CVCVC) (الشكل 1)، وقد تناولنا كيف يمكن تطبيق منهجيتنا على الأنواع الأخرى من الأفعال وعلى الأجزاء الأخرى من الكلام.
.1.5 تطبيق المنهجية على أنواع أخرى من الأفعال :
إن معالجة قواعد تصريف الأفعال في اللغة العربية على المرحلتين الرئيسيتين والتي تم عرضها من خلال هذه الورقة يمكن توسعتها لتشمل صيغة الأفعال المبنية للمجهول والأفعال المشددة المهمّزة في جذرها ومختلف نماذج الأفعال المخففة والمشددة. بالفعل ليس كل النماذج معنية بوجود حرف علة في جذر الفعل أو تخفيف (مثال: النماذج CVCCV, CaaCVC, taCVCCVC ونماذج أخرى) فإن البنية الشجرية الفرعية لها هي أقل كثافة وأقل تشعبا من النموذج CVCVC، فالمعالجة على مرحلتين تعمل كذلك على تحويل الأفعال ذات الجذر الأول المخفف، خاصة الجذر "w"، الذي يحذف ويسقط في صيغة الفعل الناقص المبني للمعلوم (الجذر التام "ورد" "warad"، الجذر الناقص "رد" "- rid -"). وبصفة تبادلية يمكن وضعه، أي الفعل ذو الجذر الأول المخفف، في المعجم غير المنتظم؛ حيث يقوم المشكل بالرجوع إليه - المعجم- عند الوصول إلى عقدة الورقة وتكون الأسبقية في تطبيق أي من القواعد التحويلية.
.2.5 تطبيق المنهجية على أجزاء أخرى من الكلام :
إن منهجية المرحلتين في توليد قواعد الصرف في اللغة العربية لها ايجابيات لعملية التوليد الصرفي والإعرابي للأسماء والصفات؛ حيث الجمع السالم للكثير من الأسماء في اللغة العربية، خاصة منها أسماء المذكر السالم، لا يتم تشكيلها بانتظام بواسطة إضافة اللواحق؛ في حين أن الجذر في حد ذاته يتحمل كل التغييرات الموافقة لمجموعة النماذج (مثال: جمع رجل رجال rajul rijaal) وهذا ما يؤدي إلى استدعاء ما يسمى "بجمع التكسير". يتم إعراب جمع التكسير وفقا للحالة (حالة الرفع، حالة المضاف إليه أو الجر، accusative) والنكرة definitness، إلا أنه مبدئيا هو نفس الإعراب بالنسبة لأغلبية الأسماء المفردة المؤنثة والمذكرة على حد السواء [16] ونفس الأمور المنطبقة على الأسماء تنطبق كذلك على الصفات (النعوت).
.3.5 النتائج :
وكنتيجة للتميز والفصل بين مشكل التغييرات التي تحدث على مستوى الجذور عنه في الإضافات من البوادئ واللواحق، قمنا بوضع وبناء نظام إحصائي حسابي لقواعد الصرف في اللغة العربية بعدد قليل من القواعد؛ وهذا من شأنه أن يُحسن من الحيز الفعلي للنظام والحفاظ عليه عن طريق مضاعفة القواعد وتبسيطها في نفس الوقت وذلك بعزل مختلف أنواع التغييرات المحدثة.
لقد تم تجريب النظام على ملف مكون من أكثر من ألف (1000) فعل (يشمل ذلك الأفعال المشددة وكذا الأفعال المخففة) و1200 اسما (تتضمن الأسماء المصوتة وأسماء جمع التكسير).
يحتوي نظام التوليد الصرفي على واجهة مدمجة مع نظام الترجمة الآلي المتدخل اللغات (,[17][14]).
¹ الـخـاتــمة :
قمنا في هذه الدراسة بعرض النموذج (الإحصائي) الذي يستعمل المولد الصرفي للغة العربية بواسطة فصل وعزل الحروف الواسطة المتغيرة (حروف العلة) في الأفعال والتي تحدث على مستوى جذور اللغة العربية من خلال عملية إضافة البوادئ واللواحق. تعمل منهجية المرحلتين بتقليص عدد قواعد التحويلات الصرفية الضرورية في هذه العملية، وهذا ما يسمح لمولد اللغة العربية أن يكون أكثر صغرا وأكثر بساطة وأكثر سهولة في الاستعمال.
ترجم من طرف:
شركة كليك لخدمات الحاسوب
الـمـراجــع :
Aronof, M Morphology by itself : stem and infectional class. MIT Press; CambredgMass (1994).
Beard R; Lexeme-Morpheme Base Morphology; A general theory of infrction and word formation State Universty of new York Press (1995).
Beesly K Finite State Description of Arabic morphology In the proceedind of Cambredge Bilingual Computing in Arabic and English (1990).
Beesly K Finite State Description of Arabic morphological Analysis an Generation In Proceedind COLING 96 Vol 1 89 94 (1990).
Bessly K Consonant Spreading of Arabic Stem In Proceedind COLING 96 (1998).
Cavalli Sphorza V Soudi A Mitamura Arabic Morphology Generation Using Concatenative Strategy In Proceeding Of NAACL 2000 W A (2000).
Hudson G Arabic Root and Pattern Morphology Tiers Journal of Linguistics 22-85-122 (1986).
Kay M Non-Concatenative Finite State Morphology In Proceeding of the third Conference of the European Chapter of The Association Of Computaional Linguistics Copenhagen Danemark 2-10 (1990).
Kiraz G Multi-Tape Tow Level Morphology Acase Study In Semetic Non Leaner Morphology In Proceeding Of COLONG 94 Vol1 180-186 (1994).
Koskenniemi K Tow- Level morphology ; A General Comptutaional Model for Word- Form Recognition and Production PhD Thesis University on Helsinki (1983).
Leaviti J:R MORPHE Morphological Rules Copmlie Technical Repport CMU-CMT 94 memo (1994).
McCarthy J , On Stress And Syllabefication In Linguistic Inquiry Vol 10 343-365- 418 (1994).
McCarthy J prosodic Theory Of Non Concatenative Morphology In Linguistic Inquiry Vol 12 373-418 (1987).
Nyberg E H and Mitamura T The Kant System Fast Acurat High Quality Translation In Pratical Domains In Proceeding of COLING’ 94 (1994).
Soudi A ; Cavalli Sforza A computational Lexeme based treatement of Arabic Morphology In Proceedind Of Workshop On Arabic Language processing ACL 2001 Toulouse (2001).
Soudi A ; Cavalli Sforza Arabic Noun System In Proceeding of the Arabic Processing Conference University of Manouba (Tunisie) (2001a).
Soudi A ; Cavalli Sforza V, Jamari A Prototype English To Arabic Intreligua Based MT System In Proceeding of Workshop On Arabic Language Ressources and Evaluation Status and prospect , LREC 2002 Las Palmas (2002b).
Soudi, A Computational Lexeme-Based Treatement of Arabic Morphology. Doctorat d’Etat (PhD) Thesis Mohamed V university Rabat (2002).
Wher H. A dictionnary of Modern Written Arabic JM Cowan Editor Spoken language Services Ithaca NY fourth Ed (1971).*Wright, W. a grammar of the Arabic language, Cambridge, Cambridge University Press, Third Ed (1988).
1 مركز اللغات والإتصال، المدرسة الوطنية للصناعة المنجمية.
شارع الحاج أحمد شركاوي، ص ب 753 أغدال، الرباط، المغرب
الهاتف : 212 37 68 02 31 الفاكس : 212 37 77 10 55
assoudi@enim.ac.ma
2 جامعة سان فرانسيسكو، قسم علم الحاسوب،
1600 شارع هولواي، سان فرانسيسكو ، CA 94132
الهاتف: 415/338-1008الفاكس: 415/338-6826
mailto:vcs@sfsu.edu vcs@sfsu.edu
الـمـسـتـخـلص
نقوم من خلال هذه الورقة بتقديم النموذج الإحصائي الخاص بتوليد الصرف في اللغة العربية على مرحلتين رئيسيتين وهذا بتمييز التغيرات التي تتم بزيادة حروف في وسط الفعل في الجذر العربي من خلال بوادئ ولواحق الكلمات والأفعال. يرتكز هذا النموذج على الفروق والاختلافات الشجرية وقواعد التحويلات؛ فعند التفريق، في إشكالية تغيرات الجذر، من خلال البادئة واللاحقة من شأنه تقليص، وبشكل معتبر، عدد قواعد التحويلات المطلوب إجراؤها وهذا ما يسمح لمولد اللغة العربية أن يكون أكثر صغرا وأكثر بساطة وسهولة في الاستعمال.
يمنح لنا الإطار الصرفي القائم على اللفظLexeme Based Morphology Framework [1, 2] الدعامة النظرية للتمثيل الذي نحن بصدده في قواعد الصرف في اللغة العربية والذي يرتكز على الجذور، عكس مقاربة "طرق الجذر + النموذج + اللفظ" المتبعة من قبل العديد من الباحثين. لقد استعملنا المُشَكِّلْ MORPHE [11] مصنف القاعدة الصرفية وذلك لدمج المصادر اللغوية؛ كما تم اختبار هذه الأداة على مجموعات فرعية لأفعال مصرفة تحتوي على أفعال مجوفة ومجموعة أخرى متنوعة من الأفعال والأسماء المشددة والمخففة والمتضمنة لأسماء في صيغة نماذج جمع التكسير والأسماء المصوتة. نركز في هذه الدراسة على صرف وإعراب الفعل كما تتناول كذلك آفاق الاستعمال الواسع لهذه المنهجية.
¹ الـكـلمات الـدالـة :
المعالجة الصرفية للغة العربية؛ البناء الصرفي؛ التوليد.
1. الـمـقـدمــة :
يعتبر صرف اللغة العربية نظام غير تسلسلي، يتوقف أساسا على معالجة جذور الحروف والكلمات بطريقة غير تسلسليةّ؛ وهذا باستعمال مختلف العمليات كـزيادة الحروف في وسط الكلمات ومضاعفتها (حروف العلة). إن نوع الإحصاء الصرفي للغة العربية والمقبول والمعتمد من قبل اللغويين هو ذلك الذي اقترحه ماك كارتي McCarthy [13]؛ والذي مفاده أن الجذور تتشكل من الارتباطات الاشتقاقية لجذر الكلمة Morphème ولحن الحركة اللذين يتم جمعهما وفقا لنموذج قاعدي (قانوني). يندمج الجذرroot مع النموذج ليشكل في النهاية شكل الكتابة أو جذر الكلمة stem (الرسم)؛ فعلى سبيل المثال في الشكل التالي "كتب" kataba تتركب من الحروف ك، ت، ب ktb لتشكل "مفهوم الكتابة" بإضافة الحركات "الفتحة" a a وهكذا تندمج الحروف والحركات على حسب الكلمة المراد تشكيلها وفقا للقاعدة والنموذج التالي: CVCVC (C=consonant, V=vowel) (أي الحرف والحركة). تحاول جل العمليات الإحصائية الصرفية تجسيم صرف اللغة العربية؛ والتي نجدها في أعمال الكثير من المختصين في الميدان، ونذكر على سبيل المثال لا الحصر: نموذج الحالة المتناهية غير التسلسلية لـ كاي Kay (Kay’s non-concatenative Finite State model[8] ونموذج متعدد التثبيت (التسجيل) ذو المستويين لـ كيراز Kiraz Kiraz’s Multi-TapeTow- Level model[9] ونموذج المستويين لـ بيسليBeesly Beesly’s Tow-Level model [3, 4, 5] كل هذه النماذج تعكس انفصال المستويات الذي تم ذكره سابقا عند ماكارتي (المرجع نفسه).
تتقيد دراستنا الإحصائية هذه والخاصة بقواعد الصرف في اللغة العربية بمقدمات المعجم الصرفي (LBM) القائم على المطلب الذي مفاده أن الجذر هو الشكل الإعرابي الوحيد للمعجم (LEXEME) وهي العبارة المعجمية المنتمية للمجموعات المعجمية التركيبية للفعل والاسم والصفة والحال؛ كما أنه يعتبر تمثيل غاية في التعقيد، يعمل على ربط المعنى مع مجموعة المفردات النحوية المرتبطة بها مع أشكال الكلمات الموافقة لها. ففي نموذج LBM تعتبر المعجميات (LEXEME والحروف المستقلة العناصر النحوية الدنيا. إن تصريف الأفعال أو اشتقاق الألفاظ – البوادئ واللواحق والمضاعفة (التشديد) وزيادة الحروف المزيدة وسط الكلمات – ليست عناصر نحوية في حد ذاتها وإنما هي عبارة عن عبارات صوتية للعمليات التي تجسد وتطبق العناصر النحوية القاعدية. إن الجذر ومختلف العمليات التي تحدث عليه يصبح مركز التمثيل وهذا ما يجعل منهجيتنا تختلف عن الطرق والمناهج السابقة في مجال التمثيلات الإحصائية لقواعد الصرف في اللغة العربية (مثال: [3, 4, 5]، [9])؛ تمنح هذه المنهجية وضعية متساوية لكل العناصر المركبة للكلمة العربية (الجذر والنموذج والتصويت) وذلك بوضعها في معاجم منفصلة، وللتفصيل أكثر حول هذه الطريقة والمناهج الأخرى التي تعتني وتهتم بقواعد الصرف في اللغة العربية يمكن الرجوع إلى المراجع المذكورة في البيبليوغرافيا [18].
2. قـواعـد صـرف الـفـعل فـي اللـغـة الـعربـية :
إن التنوع والغنى في أشكال رسم الفعل العربي بقدر ما يمثل ميزة لها بقدر ما يمثل كذلك إشكالا عويصا ومربكا في كثير من الأحيان لكل من ٌيقبل على دراسة اللغة العربية. ُيعرب الفعل العربي طبقا لأحدى النماذج التقليدية المعروفة؛ حيث أن هناك خمسة عشر مصدرا ثلاثيا، تسعة منها مشتركة تتميز بفروق طفيفة فيما بينها ويمكن إيجاد ضمن كل صرف/ نموذج نمط كلي: صيغتين (الفعل التام والفعل الناقص) وصيغتين (المبني للمعلوم والمبني للمجهول) وخمس صيغ للفعل (الدال والشرطي وصيغة الأمر وصيغة الناشط ENERGITIC) بالإضافة إلى زيادة البوادئ واللواحق وعمليات الإعراب والاشتقاق التي يمكن أن تُحدث تغييرا في شكل الكلمة بإضافة حروف زائدة في وسط الكلمة (حروف العلة) وهذا في وجود مختلف الملامح البنيوية والإعرابية مثل بعض الحروف. يمكن تصنيف جذور الأفعال العربية كما هو مبين في (الشكل رقم 1). الفرق الأولي الذي يمكن ملاحظته هو بين الأفعال المشددة والأفعال المخففة strong & weak verbs؛ فالأفعال المخففة هي تلك الأفعال التي لها حروف مخففة (w or y) واحد أو أكثر من هذه الحروف في جذوره، أما الفعل المشدد هو ذلك الفعل الذي لا يحتوي على الجذور المخففة.
تحتمل الأفعال المشددة تغييرات على مستوى الحركات من الفعل التام إلى الفعل الناقص؛ حيث تختفي الحركة الأولى في الفعل الناقص. أما الأفعال التي لها حركة في منتصف الجذر في الفعل التام "الفتحة" «a » تتحول إلى نفس الحركة « a » : "قطع يقطع "Qata a Yaqta u ، إلى الكسرة « i » ضرب يضرب Daraba Yadibu، أو إلى الضمة « u » كتب يكتب Kataba Yatubu في الفعل الناقص.
لا يمكن للأفعال المبنية على الكسرة في منتصف الجذر في الفعل التام أن تتحول إلا نحو "الفتحة" « a » (مثال: شرب يشرب) (shariba Yashrabu) أو إلى الكسرة « i » (مثال: حسب يحسب) (Hasiba YaHsibu).
الأفعال المنية على الضمة في منتصف الجذر في الفعل التام لا يتحول إلى الفعل الناقص (مثال: حسن يحسن) (Hasuna YaHsunu)، أما في الأفعال المشددة فإنه لا يوجد هناك تغير لا في الفعل التام ولا في الفعل الناقص في رسم شكل الأفعال لا في الجنس ولا العدد.
الأفعال المجوفة هي تلك الأفعال التي تضم في منتصف جذرها التخفيف؛ ففي زمن الفعل التام والفعل الناقص يمكن تجسيدهما برسمين احدهما طويل والآخر قصير؛ ذلك أن استعمالها يرتبط بالجنس والعدد.
تنقسم الأفعال المجوفة إلى أربع مجموعات وهي :
1. أفعال النموذج التالي : CawaC (حرف حركة حرف) والذي له نماذج الجذر التام CuC (حرف ضمة حرف) وكذا CuuC (حرف ضمة مشددة (مد) حرف) وكذا نماذج الجذر الناقص CuC (حرف ضمة حرف) و CuuC (حرف ضمة مشددة). مثال الفعل زار zaara المشتق من زيارة zawara وفعله التام زر zur وجذور الفعل الناقص زر و زور zur zuur. مثال على ذلك زرت (فعل ماضي) ويزور (فعل مضارع).
2. أفعال النموذج التالي: CawiC (حرف فتحة ضمة حرف) و الذي له نماذج الجذر التام CiC (حرف كسرة حرف) و CaaC (حرف فتحة مشددة) وكذا نماذج الجذر الناقص CaC (حرف فتحة حرف) وCaaC (حرف فتحة مشددة (مد) حرف). مثال على ذلك الفعل نام naama المشتق من النوم nawima له جذور الفعل التام نم nim ونام naama وجذور الفعل الناقص نم ونام nam & naam . مثال نام naama وينمن yanamana.
3. أفعال النموذج التالي: CayaC (حرف فتحة مخففة حرف) والذي له نماذج الجذر التام CiC (حرف كسرة حرف) و CaaC (حرف فتحة ممددة حرف) ونماذج جذر الفعل الناقص CiC (حرف كسرة حرف) و CiiC (حرف كسرة ممدة حرف). مثال باع المشتق من البيع baa’a من baya’a له جذور الفعل التام بع bi و باع baa وجذور الفعل الناقص بع وبيع bi & bii.
4. أفعال النموذج التالي : CayiC (حرف فتحة حرف كسرة حرف) والذي له نماذج الجذر التام CiC & CaaC وهي (حرف كسرة حرف) و (حرف فتحة ممدة حرف) على التوالي وكذا نماذج جذر الفعل الناقص CaC & CaaC وهي (حرف فتحة حرف) وحرف فتحة ممدة حرف) على التوالي. مثال الفعل هاب haaba المشتق من المصدر هيبة hayiba له جذور الفعل التام هب hib وهاب haab وجذور الفعل الناقص هاب hab وهاب haab .
تبين الدراسات ذات العلاقة بالموضوع [3,4,5,9] أن كل الأفعال المنتمية إلى المجموعات السابقة تفترض أن النموذج التي تبنى عليه هو: CVCVC (حرف حركة حرف حركة حرف) وهذا الأخير لا يبين المجموعة الإعرابية والصرفية للفعل المعرب وهذا ما يخلق صعوبة في التنبؤ بنوع الجذر المستعمل. ولتجنب هذه المشاكل نعمل على إبقاء المعلومة في منتصف الجذر وإبقاء الحركة على مستوى قاعدة رسم الفعل. عند عملية التوليد الصرفي يمكن استعمال ومعالجة المجموعتين 2 و 4ضمن مجموعة واحدة لأن لهما نفس جذور الفعل التام والفعل الناقص.
سنعمل خلال ما سيأتي من هذه الدراسة على تقديم أداة المشكل Morphe tool ووصف منهجية التجسيم للأفعال المشددة والأفعال المجوفة.
3. الـنـظام الـقاعـدي للـمـشـكّل (MORPHE) :
MORPHE [11] هو عبارة عن مشكّل للقواعد المرفولوجية مكتوب بلغة Common Lisp ؛ حيث يتم على مستواه وصف صوت ونطق اللغة باستعمال نوعين من البنية التركيبية؛ تتمثل الأولى في الشكل الهرمي الصوتي وتتمثل الثانية في مجموعة من القواعد التحويلية المرتبطة بصفة عقدة الهرم الصوتي. يقوم المشكل بوضع هذا الوصف إما ضمن برنامج توليد الكلمة أو ضمن برنامج إعراب الكلمة؛ فالمولد الصرفي يأخذ بعين الاعتبار الملمح البنيوي (FS) Feature Structure ضمن المدخلات وقائمة البنية، حيث تمثل عناصرها أزواج ملامح القيمة Feature-value Pairs (FVP، يمكن لجزء القيمة لـ (FVP) أن تكون دقيقة أو تكون الملمح البنيوي (FS) في حد ذاته وذلك بجعلها بنية تكرارية. فعلى سبيل المثال عندما يقوم الملمح البنيوي بتوليد الفعل العربي زرت zurtu تكون العملية على الشكل التالي :
(الجذر زيار، المجموعة: v، زمن الفعل أو صيغته: فعل تام، الصيغة: دال، الصيغة: مبني للمعلوم، العدد: مفرد، الضمير: الأول).
إن اختيار ملمح الأسماء والقيم ما عدا الجذر المحدد للموضوع النحوي والمعجمي المراد تحويله هو في حد ذاته الغاية والهدف الذي يبتغيه المستعمل. تأتي أزواج ملامح القيمة FVP ضمن الملمح البنيوي FS من مصدرين وهما: الملامح الساكنة مثل المجموعة cat (جزء من الكلام) والجذر ومن المعجم البنائي الذي يحتوي، بالإضافة إلى الرسم (الشكل) القاعدي للكلمات، يحتوي كذلك على الملامح المعجمية والصرفية ويتمثل المصدر الثاني في الملامح الديناميكية (الحركية) مثل زمن الفعل والعدد؛
كما تم وضعه من قبل مستدعي المشكل ضمن سياق نظام آلة الترجمة وهو ما يمثل بكل بساطة تركيب التوليد المعجمي، أما مخرجات المولد الصرفي فإنها تتمثل في صف وترتيب الحروف داخل الكلمة.
1.3 الشكل الهرمي الصرفي (MFH) :
يعمل الشكل الهرمي الصرفي على تنظيم القواعد التحويلية المتعلقة بقيم الملامح في الملامح البنيوية FS كما يعمل كشبكة تمييزية لاسترجاع القواعد المناسبة المولدة للملامح البنيوية FS. تميز كل عقدة داخلية في الشجرة جزء من الملامح البنائية المشتركة للشجرة الفرعية الكاملة. يعمل جذر الشجرة والتي هي عقدة خاصة ¤جذر¤ على ربط كل الأشجار الفرعية فيما بينها. توافق عقد الأوراق الأشكال الصرفية المميزة في اللغة وتكون كل عقدة في الشجرة تحت الجذر مبنية عن طريق الشكل الصرفي الذي تٌحدد العقدة الأم والارتباط المنطقي لـ FVP التي تميز العقدة البنت من العقدة الأم والعقد الإخوة. فعلى سبيل المثال في الشكل الصرفي التالي:
(morph-form v-stem-f1-act-perf-1/2 v-stem-f1-act-perf (person or 1 2)))
يبين لنا أن العقدة v-stem-f1-act-perf-1/2 هي ابنة العقدة v-stem-f1-act-perf كما تضيف معلومة ملح الشخص (person) يجب أن يأخذ القيمتين إما 1 أو 2.
.2.3 القواعد التحويلية :
تؤثر القاعدة المرتبطة بكل عقدة ورقة على التحويلات الصرفية المرغوب فيها لتلك العقدة؛ حيث تشتمل العقدة على واحدة أو أكثر من الشروط المتبادلة بصفة إقصائية؛ فجزء "إذا" « if » من الشرط هو نموذج تعبيري منتظم يُربط مقابل قيمة خاصية الجذر (a string)، أما جزء "إذن" « Then » فإنه يحتوي على واحد أو أكثر من المعاملات المطبقة في ذلك الترتيب وتضم هذه المعاملات الجمع والحذف وإبدال البوادئ واللواحق وزيادة الحروف الوسطية (حروف العلة). تتمثل مخرجات التحويلات في تحويل وتر الجذر (ترتيب الحروف في الجذر)، كما تمثل القاعدة التحويلية المنتجة للكلمة " زر " « zur » جزء من الكلمة العربية "زرت" « zurtu »، حيث تتمثل فيما يلي:
(1)
(morph-rule v-stem-f1-act-perf-1/2
(“^%(cons) (awa) % (cons)$”
(ri ¤1¤ « u »))
لهذه القاعدة الاختبار التالي: (“^%(cons) (awa) % (cons)$” فكلا من الرمزين "^" و "$" يدلان على بداية ونهاية صف الحروف على التوالي؛ أما الرمز {} فإنه يُستعمل للدلالة على المتغيرات مع مجموع هذه القيم؛ فعلى سبيل المثال تمثل البنية "(cons)" في القاعدة السابقة ربط أي حرف معرف لأي من القيم المحتملة للمتغير "(cons)" (=consonant) والأوتار الموضوعة بين المزدوجتين في "جزء إذا" « if part » من القاعدة (مثال ذلك الاختبار) يشير إلى التسجيلات التي يمكن للمشكّل الوصول إليها في "جزء إذن" « Then part » من القاعدة وبعدها يتم تعداد وحساب هذه التسجيلات؛ بحيث يمكن للمشكل morphe أن يصل إلى تسع تسجيلات، ففي الحالة التي أمامنا هناك تسجيل واحد فقط يحيل أو يشير إلى "جزء إذن" من القاعدة كـ¤1¤. "RI" يكون بديلا للحرف المزيد (INFIXE) ويعوض المعامل ليكون بديلا للدليل الأول مع الدليل الثاني لمدخلات صف الكلمات (الجذر) وهذا يعني أنه يكون بديلا للوتر (awa) مع حركة الضمة "u". إن تطبيق هذه القاعدة في مدخلات "zawar" يُنتج الشكل الكتابي "zur".
.3.3 المسار المنطقي والأشكال المنتظمة :
هناك افتراض مفاده أنه ليس كل تصريف وإعراب في اللغة العربية هو تصريف منتظم، ومن هنا يعمل المشكل Morphe على تحمل الأشكال غير المنتظمة كجزء من مسارها المنطقي. عند عملية التوليد ٌتربط الخصائص البنيوية مقابل الخصائص المحددة لكل شجرة فرعية للشكل الهرمي الصرفي MFH إلى غاية الوصول إلى عقدة الورقة، وبهذا يقوم المولد بفحص الأشكال المعجمية غير المنتظمة للمدخل المكشف بقيمة خاصية الجذر واسم العقدة وإرجاعها في حالة وجود مدخل لها، من جهة أخرى يحاول المشكّل تطبيق القاعدة التحويلية المرتبطة بعقدة الورقة ، وفي حالة عدم وجود قاعدة تحويلية أو شرط يناسب قيمة الجذر تصبح قيمة خاصية الجذر غير قابلة للتغيير.
4. تـصريـف الـفعل العربـي، الـتولـيد في الـمشكل Morphe :
كما تم توضيحه في منهجيتنا سابقا سنقوم الآن بمناقشة حالة الأفعال المجوفة، حيث تم إعطاء خصائصها في القسم الثاني من هذه الدراسة والتي بينا فيها كذلك كيف أدمجنا معالجتها مع أكثر الأفعال المنتظمة، كما سنتناول كيف بإمكان مد وتوسيع هذه المنهجية لتشمل المجموعات الأخرى من الأفعال وأجزاء أخرى من الكلام.
ٌيؤكد من خلال الاستعمال المألوف والمتفق عليه مع القواعد المقررة في الرسم والشكل أن التحويلات الصرفية الضرورية لقيمة خاصية جذر الكلمة أنه يٌمكن تحديده بقاعدة واحدة مرتبطة بعقدة المصراع للشكل الهرمي، وهذا الافتراض ما يدعم هنا اللغة العربية؛ إذ يعمل على إظهار الشكل الهرمي الصرفي MFH بأكثر كثافة ويتم وضع قاعدة حيث يتم تكرار نفس العمليات التحويلية في قواعد متعددة. يمثل مصدر التكرار نظام الفعل في اللغة العربية نفسه؛ بحيث يمكن لجذور الأفعال أن تختلف في صيغتي المبني للمعلوم والمبني للمجهول وفي صيغ الفعل التام والفعل الناقص وتتوقف هذه التغييرات على شكل الفعل؛ فعلى سبيل المثال الأفعال المجوفة لنفس الصيغة والزمن المصرف فيه يتغير فيها الجذر ثلاثة عشر احتمالا للارتباطات المحتملة بين العناصر التالية: الشخص - الجنس - العدد. في المقابل فإن البوادئ واللواحق المشتركة والمرتبطة بكل ارتباط "الشخص - الجنس – العدد" تبقى مستقرة نسبيا في كل أنواع الأفعال الأخرى مع تبيان بعض حدود الاحتكاك مع الأفعال المخففة.
إن استعمالنا للمشكّل Morphe لتمثيل تصريف الفعل العربي بين لنا أنه بإمكاننا تقليص، وبطريقة فعلية، عدد تكرارات القواعد التحويلية بفصل جذر التحويلات وتغييرات البادئة/ اللاحقة ([6,15]). حصص MFH للغة العربية مبينة في (الشكل رقم1). بما أن Morphe يتحمل MFH واحدة فقط عملنا على خلق شجرتين فرعيتين تحت الشجرة الفرعية للفعل، حيث عقدة جذره مبينة في (الشكل رقم 2) بواسطة FVP (cat v) التي تحتوي إحدى الشجرتين الفرعيتين والمبينة بواسطة FVP (chg stem)(مثال: مولد الجذر)، على قواعد لتغييرات الجذر؛ أما الشجرة الفرعية الأخرى والموضحة بواسطة FVP (chg psfix) تحوي قواعد للإضافات البادئة واللاحقة. يتم استدعاء المولد الصرفي مرتين؛ المرة الأولى لإرجاع الجذر المعدل؛ حيث يٌستبدل كقيمة لخاصية الجذر قبل الاستدعاء الثاني الذي يهتم بالبوادئ واللواحق؛ فعلى سبيل المثال الفعل زرت zurtu حيث الاستدعاء الأول يعمل على إيجاد وتطبيق القاعدة التحويلية المبينة في القسم 3.2 في الأعلى؛ أما الاستدعاء الثاني فإنه يعمل على إيجاد وتطبيق القاعدة : (morph-rule v-psfix-perf-1-sg ("" (+s "tu")))
الذي يعمل على إضافة اللاحقة "tu".
يوضح (الشكل رقم 1) أوجها أخرى من تمثيل قواعد الصرف في اللغة العربية؛ فالمعلومة التي نحتفظ بها في معجم الأفعال المتضمنة للجذر (المعطاة كقيمة لخاصية الجذر للفعل زار zawar) وكذا شكل الفعل (مثال الشكل 1)) يمكنها أن تغير الحركة حيث يتطلب ذلك، أما بالنسبة للأفعال المجوفة فإن الجذر الوسطي (w or y) وحركتها في خاصية الجذر هو الذي ٌيحدد التحويلات المطلوبة للجذر في الفعل التام والفعل الناقص، فعند فصل تغييرات الجذر عنها في التغيرات التي تحدث على مستوى البوادئ واللواحق البادئة/اللاحقة لمختلف أنواع التغييرات التي تحدث على مستوى الجذر.
بينما في MFH الحالي فإن كل العقد تُعطي اسما (ما يفترض من الناحية المثالية أن واحدة تعكس مسار خاصية القيمة المستعملة للوصول إليها). الشكل أعلاه لا يبين إلا العقد "أزواج خاصية القيمة المميزة".
لا يحدث أي تغيير للجذر في الأفعال المنتظمة المشددة وفي الفعل التام في صيغة المبني للمعلوم؛ من جهة أخرى تستعمل الأفعال المجوفة جذر طويل ووسط طويل؟ اليف alif (مثال مد طويلa طويل مثال دام daam) لضمير المفرد الغائب وثنائي (مذكر ومؤنث) وضمير الجمع الغائب المذكر السالم كما هو موضح في (الشكل 2)، أما باقي الارتباطات ضمير (شخص) - العدد - الجنس فإن لها جذر قصير وحركتها تتوقف على جذر الفعل المبطئ، كما تم تبيانه سابقا. تجري القواعد التحويلية المرتبطة بعقدة المصراع تحويلات لقيمة خاصية الجذر للجذر الطويل والجذر القصير. إن إمكانية تساوي العقد يتم الحصول عليه بواسطة مختلف المسارات في MFH (مثال : مختلف تعاقبات FVP ) الذي من شأنه أن يقلص عدد القواعد المطلوبة لمعالجة الأفعال المجوفة؛ وهذا يعني أن كلتي عقدتي الورقتين والتي لها جذر قصير بإمكانهما أن تكونا متساويتين؛ لذلك تعالج بقاعدة واحدة. هناك قاعدة أخرى ضرورية لمعالجة الجذر الطويل لعقدتي الورقتين الأخرتين. ولإعطاء شرح وتوضيح أكثر للوصف السابق نعطي الأمثلة التالية :
I. مثال عن الفعل الأجوف :
المداخلات : البنية الخصائصية : ((الجذر "زار" ) (صيغة المبني للمعلوم) (الضمير (¤أو¤ 1 2 )) (الشكل 1) (صيغة الفعل التام)
في الاستدعاء الأول للمشكل MORPHE (تغيير الجذر) (chg stem) (مثال v-stem-f1-act-perf-12) يتم اجتياز الشجرة الفرعية السابقة ويتحول بذلك الجذر زر zur.
(2)
(morph-rule v-stem-f1-act-perf-1/2
("^%{cons}(awa)%{cons}$"
(ri *1* "u"))
فعندما يتم استدعاء المشكل للمرة الثانية فإن شجرة تغييرات البادئة/اللاحقة يتم اجتيازها إلى غاية الوصول إلى العقدة v-psfix-perf-f1-sg وهنا يطبق المشكل القاعدة المرتبطة بهذه العقدة؛ أي:
(3)
(“”
(+ “tu”).
تضيف هذه القاعدة اللاحقة "tu" للجذر "nim"؛ حيث يقوم المشكّل بإرجاع الكل للحصول على الفعل « nimtu »، للتذكير فإن اختبار هذه القاعدة لاغ، كما هو مبين في الاقتباس “” (يُطبق في كل الحالات).
II. مثال عن الفعل المشدد :
المدخلات : البنية الخصائصية: ((الجذر "كتب" ) (صيغة المبني للمعلوم) (الضمير (¤أو¤ 1 2 )) (الشكل 1) (صيغة الفعل التام)
عند الاستدعاء الأول للمشكل فإن (تغيير الجذر) (chg stem) (v-stem-f1-act-perf-12) يقوم باجتياز الشجرة الفرعية، في هذه الحالة يحاول MORPHE تطبيق القاعدة في (2) السابق ولكنه يفشل بسبب السلسلة (الصف) (كتب) (katab) الذي لا يربط التعبير المنتظم ‘’^(cons)%(cons)$’’ (اختبار غير مرضي للقاعدة المراد تطبيقها). يقوم المشكل بتحويل قيمة خاصية الجذر وإرجاعها غير قابلة للتغيير؛ فإذا تم استدعاء المشكّل مرة أخرى يعمل(chg strem) باجتياز الشجرة الفرعية إلى غاية الوصول إلى العقدة v-psfix-perf-f1-sg؛ وبالتالي يعمل المشكّل على تطبيق القاعدة في (3) السابقة بحيث تثبت اللاحقة "tu" في الفعل كتب (katab) وتصبح بالتالي النتيجة كتبتُ katabtu.
5. الـتـمديـد (الإضـافـات) :
لقد تم التركيز في هذه الدراسة على نوعين من الأفعال في اللغة العربية وهما الأفعال المنتظمة والأفعال المجوفة (المعتل الوسط) وفقا للنموذج (حرف حركة حرف حركة حرف) (CVCVC) (الشكل 1)، وقد تناولنا كيف يمكن تطبيق منهجيتنا على الأنواع الأخرى من الأفعال وعلى الأجزاء الأخرى من الكلام.
.1.5 تطبيق المنهجية على أنواع أخرى من الأفعال :
إن معالجة قواعد تصريف الأفعال في اللغة العربية على المرحلتين الرئيسيتين والتي تم عرضها من خلال هذه الورقة يمكن توسعتها لتشمل صيغة الأفعال المبنية للمجهول والأفعال المشددة المهمّزة في جذرها ومختلف نماذج الأفعال المخففة والمشددة. بالفعل ليس كل النماذج معنية بوجود حرف علة في جذر الفعل أو تخفيف (مثال: النماذج CVCCV, CaaCVC, taCVCCVC ونماذج أخرى) فإن البنية الشجرية الفرعية لها هي أقل كثافة وأقل تشعبا من النموذج CVCVC، فالمعالجة على مرحلتين تعمل كذلك على تحويل الأفعال ذات الجذر الأول المخفف، خاصة الجذر "w"، الذي يحذف ويسقط في صيغة الفعل الناقص المبني للمعلوم (الجذر التام "ورد" "warad"، الجذر الناقص "رد" "- rid -"). وبصفة تبادلية يمكن وضعه، أي الفعل ذو الجذر الأول المخفف، في المعجم غير المنتظم؛ حيث يقوم المشكل بالرجوع إليه - المعجم- عند الوصول إلى عقدة الورقة وتكون الأسبقية في تطبيق أي من القواعد التحويلية.
.2.5 تطبيق المنهجية على أجزاء أخرى من الكلام :
إن منهجية المرحلتين في توليد قواعد الصرف في اللغة العربية لها ايجابيات لعملية التوليد الصرفي والإعرابي للأسماء والصفات؛ حيث الجمع السالم للكثير من الأسماء في اللغة العربية، خاصة منها أسماء المذكر السالم، لا يتم تشكيلها بانتظام بواسطة إضافة اللواحق؛ في حين أن الجذر في حد ذاته يتحمل كل التغييرات الموافقة لمجموعة النماذج (مثال: جمع رجل رجال rajul rijaal) وهذا ما يؤدي إلى استدعاء ما يسمى "بجمع التكسير". يتم إعراب جمع التكسير وفقا للحالة (حالة الرفع، حالة المضاف إليه أو الجر، accusative) والنكرة definitness، إلا أنه مبدئيا هو نفس الإعراب بالنسبة لأغلبية الأسماء المفردة المؤنثة والمذكرة على حد السواء [16] ونفس الأمور المنطبقة على الأسماء تنطبق كذلك على الصفات (النعوت).
.3.5 النتائج :
وكنتيجة للتميز والفصل بين مشكل التغييرات التي تحدث على مستوى الجذور عنه في الإضافات من البوادئ واللواحق، قمنا بوضع وبناء نظام إحصائي حسابي لقواعد الصرف في اللغة العربية بعدد قليل من القواعد؛ وهذا من شأنه أن يُحسن من الحيز الفعلي للنظام والحفاظ عليه عن طريق مضاعفة القواعد وتبسيطها في نفس الوقت وذلك بعزل مختلف أنواع التغييرات المحدثة.
لقد تم تجريب النظام على ملف مكون من أكثر من ألف (1000) فعل (يشمل ذلك الأفعال المشددة وكذا الأفعال المخففة) و1200 اسما (تتضمن الأسماء المصوتة وأسماء جمع التكسير).
يحتوي نظام التوليد الصرفي على واجهة مدمجة مع نظام الترجمة الآلي المتدخل اللغات (,[17][14]).
¹ الـخـاتــمة :
قمنا في هذه الدراسة بعرض النموذج (الإحصائي) الذي يستعمل المولد الصرفي للغة العربية بواسطة فصل وعزل الحروف الواسطة المتغيرة (حروف العلة) في الأفعال والتي تحدث على مستوى جذور اللغة العربية من خلال عملية إضافة البوادئ واللواحق. تعمل منهجية المرحلتين بتقليص عدد قواعد التحويلات الصرفية الضرورية في هذه العملية، وهذا ما يسمح لمولد اللغة العربية أن يكون أكثر صغرا وأكثر بساطة وأكثر سهولة في الاستعمال.
ترجم من طرف:
شركة كليك لخدمات الحاسوب
الـمـراجــع :
Aronof, M Morphology by itself : stem and infectional class. MIT Press; CambredgMass (1994).
Beard R; Lexeme-Morpheme Base Morphology; A general theory of infrction and word formation State Universty of new York Press (1995).
Beesly K Finite State Description of Arabic morphology In the proceedind of Cambredge Bilingual Computing in Arabic and English (1990).
Beesly K Finite State Description of Arabic morphological Analysis an Generation In Proceedind COLING 96 Vol 1 89 94 (1990).
Bessly K Consonant Spreading of Arabic Stem In Proceedind COLING 96 (1998).
Cavalli Sphorza V Soudi A Mitamura Arabic Morphology Generation Using Concatenative Strategy In Proceeding Of NAACL 2000 W A (2000).
Hudson G Arabic Root and Pattern Morphology Tiers Journal of Linguistics 22-85-122 (1986).
Kay M Non-Concatenative Finite State Morphology In Proceeding of the third Conference of the European Chapter of The Association Of Computaional Linguistics Copenhagen Danemark 2-10 (1990).
Kiraz G Multi-Tape Tow Level Morphology Acase Study In Semetic Non Leaner Morphology In Proceeding Of COLONG 94 Vol1 180-186 (1994).
Koskenniemi K Tow- Level morphology ; A General Comptutaional Model for Word- Form Recognition and Production PhD Thesis University on Helsinki (1983).
Leaviti J:R MORPHE Morphological Rules Copmlie Technical Repport CMU-CMT 94 memo (1994).
McCarthy J , On Stress And Syllabefication In Linguistic Inquiry Vol 10 343-365- 418 (1994).
McCarthy J prosodic Theory Of Non Concatenative Morphology In Linguistic Inquiry Vol 12 373-418 (1987).
Nyberg E H and Mitamura T The Kant System Fast Acurat High Quality Translation In Pratical Domains In Proceeding of COLING’ 94 (1994).
Soudi A ; Cavalli Sforza A computational Lexeme based treatement of Arabic Morphology In Proceedind Of Workshop On Arabic Language processing ACL 2001 Toulouse (2001).
Soudi A ; Cavalli Sforza Arabic Noun System In Proceeding of the Arabic Processing Conference University of Manouba (Tunisie) (2001a).
Soudi A ; Cavalli Sforza V, Jamari A Prototype English To Arabic Intreligua Based MT System In Proceeding of Workshop On Arabic Language Ressources and Evaluation Status and prospect , LREC 2002 Las Palmas (2002b).
Soudi, A Computational Lexeme-Based Treatement of Arabic Morphology. Doctorat d’Etat (PhD) Thesis Mohamed V university Rabat (2002).
Wher H. A dictionnary of Modern Written Arabic JM Cowan Editor Spoken language Services Ithaca NY fourth Ed (1971).*Wright, W. a grammar of the Arabic language, Cambridge, Cambridge University Press, Third Ed (1988).
Aucun commentaire:
Enregistrer un commentaire