م. عـزالـديـن، CIMOS، فرنسا.
قامت شركة CIMOS منذ تأسيسها بدمج نشاطاتها المتعلقة بالترجمة التقليدية وذلك بتطوير برامج متعددة اللغات. كانت الترجمة تنجز بطريقة يدوية، من العربية إلى اللغات الأوروبية الحية والعكس، من طرف مترجمين ذوي تكوين في الإعلام الآلي. أما فيما يخص برامج الترجمة فقد كانت تُطور من قبل مهندسين ذوي مؤهلات لغوية معتبرة ويقوم لغويون محترفون بمساعدتهم في ذلك. تحوي هذه البرامج على مسارات شاملة تأخذ بعين الاعتبار التحليل الصرفي والنحوي والدلالي لفهم نص المصدر قبل ترجمته.
فخلال السنوات الماضية كان زبائننا يقدمون لمترجمينا وثائق مهمة تتمثل في كتب الصيانة وأدلة المستعملين. وأمام الطلبات المتزايدة قررنا تألية ومكننة مسار نشاط الترجمة لاحتياجاتنا أولا واحتياجات زبائننا ثانيا، فعمدنا بذلك إلى إنشاء دائرة "الفهم الآلي للنصوص وأدوات المساعدة في الترجمة" على مستوى المؤسسة لغرض مساعدة المترجمين في عملهم وتطوير مسار نشاط الترجمة التقليدية إلى نظام الترجمة الآلية. للإشارة فإن تصميم وتشغيل هذه البرامج يقوم على نظريات القواعد اللغوية واللسانية.
لقد تم تطوير نظام الترجمة الآلية متعدد اللغات MLTS في دائرة الفهم الآلي للنصوص بالشركة والتي قامت منذ حوالي خمسة عشر سنة بجمع مصادر معجمية متنوعة (قائمة يتم تحديثها باستمرار) وهي بمثابة أداة مساعدة للمترجمين وقاعدة بيانات لبرامج الترجمة الآلية. ومنذ ذلك الحين قامت شركةCIMOS بإنجاز وتطوير مجموعة من البرامج في مجال الترجمة الآلية؛ نذكر على سبيل المثال: الناقل العربي الذي يتوفر في طبعات متعددة إنجليزي- عربي /عربي - إنجليزي، فرنسي - عربي/ عربي - فرنسي (الطبعة 3.0 في نهاية 2002).
¹ عـرض الـبرنـامــج :
قام بتطوير نظام الترجمة الآلية متعدد اللغات مجموعة من اللغويين والمهندسين ذوي خبرة عالية ومترجمين محترفين؛ فهو نظام خاص بالترجمة الآلية صُمم أساسا لمساعدة المترجمين وليس لتعويضهم في أداء وظيفتهم، فهو بإمكانه إعطاء محاولة أولية لترجمة مفهومة ومقبولة، كما يقوم بترجمة النصوص من مختلف الميادين (التجارة، الاقتصاد والمال، الإعلام لآلي...) بالاعتماد على معاجم لغوية متخصصة وعامة.
يعمل نظام الترجمة الآلية متعدد اللغات (MLTS) على خمسة مستويات مختلفة وهي :
í مستوى قاعدة النصوص المترجمة.
í مستوى التحليل الصرفي.
í مستوى التحليل النحوي.
í مستوى التحليل الدلالي.
í مستوى التحويلات (اللغة الرئيسية).
يقوم بتنسيق مقترحات قاعدة النصوص المترجمة وموضوع الترجمة بالتحويلات. فهو يعتمد على الوحدات الدلالية وعلى التمثيل الداخلي لمفاهيم اللغة.
µ مستوى قاعدة النصوص المترجمة :
عند البدء في عملية الترجمة يقوم البرنامج بالبحث أولا في قاعدة النصوص المترجمة على جملة مشابهة للجملة المراد ترجمتها ثم يبدأ بعدها باستعمال تقنيات الرص والتصفيف والفرز التقريبي (Fuzzy matching)، فإذا كانت نسبة المقاربة 100 % فهي مساواة بين سلسلتين من الحروف، أما إذا كانت النسبة أدنى من ذلك فهي جملة باختلافات طفيفة (تحتاج إلى تغيير مواقع الأسماء والأفعال والصفات أكثر منه إعراب أفعال...).
ففي هذا الصدد تقترح قاعدة النصوص المترجمة جمل تبادلية متقاربة ومتطابقة (Fuzzy matching)، حيث أنه بإمكان البرنامج القيام بتغييرات وتبديلات لأجزاء مختلفة من الجملة أو العبارة (مثل الأرقام، أسماء الأعلام) وحتى بتغيير وتحوير أجزاء مختلفة إن تطلب الأمر ذلك؛ وبهذا تصبح نتائج الترجمة الآلية حقلا كامنا عن طريقه يمكن تغذية قاعدة النصوص المترجمة، ولكن من شأن هذه الطريقة إعياء القاعدة بصفة سريعة وإطالة مدة البحث؛ ولهذا فإننا مطالبون بتطوير طرق جديدة للتصفيف والترتيب والفرز والضغط.
فعلى سبيل المثال عند ترجمة الجملة الإنجليزية "To give something to somebody"؛ علينا معرفة القيام بالتغييرات والتبديلات المناسبة حسب موضوع الحال.
أمـــثلة :
í تكتب البنت الرسالة The girl writes the letter
í يكتب الصحفي المشهور المقال The famous journalist writes the article
í عند الرجل كتاب The man has a book
í عند الرجل كتاب جيد The man has a good book
تصنف الكلمتان "the girl" و "Journalist" في نفس المجموعة، نفس الشيء مع الكلمتين "letter" و"Article"، ولهذا فإنه على مستوى قاعدة النصوص المترجمة تكون الجملتان متقاربتين ومخزنتين على شكل واحد.
µ مستوى التحليل الصرفي :
يقوم البرنامج بتحليل كل كلمة من الجملة على حدا لكي يستخلص سماتها الصرفية والنحوية (الإعراب، الجنس، العدد....). ثم يعمد إلى وضع مختلف الفرضيات على الشكل التالي:
í وضع الأسماء على الشكل المثنى.
í وضع الأفعال على صيغة المصدر.
í وضع الصفات على شكل المذكر المفرد.
í وضع الاصطلاحات التعبيرية الخاصة بثقافة معينة على الصيغة المصدرية مصرفة مع ضمير المخاطب الغائب ثم يقوم بعدها بالبحث على السلسلة الأكثر طولا بالمقارنة مع العناصر المخزنة في المجموعة المعجمية التالية :
é معجم عام يحتوي على الكلمات المألوفة.
é معجم المصطلحات يحتوي على اصطلاحات تعبيرية خاصة بثقافة اللغة المترجم إليها.
é معجم متخصص يحتوي على كلمات خاصة بميدان معين.
é معجم المستخدم يحتوي على الكلمات المضافة والمعدلة من قبل المستعملين.
و بهذا يوضع عنصر من العناصر المكونة للجملة في مجموعة لغوية "كلمات بسيطة" أو "كلمات مركبة" أو "اصطلاحات تعبيرية".
مــثال:
لتكن الجملة التالية من القرآن الكريم: "فسيكفيكهم الله".
فالبرنامج يقوم بتفكيكها في المرحلة الأولى إلى الشكل التالي: الله+هم+ك+سيكفي+ف، ثم ينتقل إلى تفكيك ثانٍٍٍ تتحصل من خلاله على الشكل التالي: الله+هم+ك+ي+س+ف.
في بعض الأحيان يمكن أن يكون لنفس الكلمة احتمالات عديدة بمجموعات مختلفة؛ فهذا النوع من الغموض كثيرا ما نصادفه، إلا أن هناك إجراءات من شأنها رفعه وإزالته. فكثيرا ما تكتب اللغة العربية بدون استعمال التشكيل كالهمزة والشدة؛ الشيء الذي يخلق صعوبات معتبرة في فهم المفردات.
í فكلمة "علم" يمكن أن تعني:. عُلِمَ، عَلَمٌ، عَلَّمَ، عِلْم، عَلِمَ.
í وكلمة "فهم" يمكن أن تعني:. فَهِمَ، فَهْم، فَهَمَّ، فَهُمْ، فَهَّمَ
í وكلمة "دين" يمكن أن تعني: دَيْنٌ، دِيْنٌ.
í ولإزالة الغموض على هذه الكلمات نقوم بتشكيلها.
í نفس الشيء مع كلمة "كل" يمكن أن تعني كَلَّ، كُلْ، كُلَّ فعند إضافة الشدة يمكن التفريق بينها.
í وكذا مع الكلمة "سال" التي يمكن أن تعني سَأَلَ، سَالَ فللتفريق بينها تضاف إليها الهمزة.
µ مستوى التحليل النحوي :
في هذا المستوى يحلل البرنامج بنية الجملة لمعرفة المجموعة النحوية لمختلف العناصر المكونة لها، ثم يقوم بعد ذلك بالتأكد من أن البنية المتحصل عليها مطابقة للقواعد النحوية للغة المترجم إليها. يقوم البرنامج بعدها بتحليل كل مجموعات العناصر التي تتركب منها الجملة كالفعل والاسم والمفعول فيه ومختلف الأدوات الإعرابية كأدوات الجر والجزم والعطف والأسماء المجرورة وأسماء الصلة والموصول الخ ... ؛ فهو بهذا الإجراء يحدد مختلف وحدات التعبير في الجملة ويقوم بوضع روابط دلالية بين مختلف هذه التراكيب والمجموعات.
يُحدد التحليل النحوي ابتداء من العناصر التي تم وضعها في المجموعات المكونة للجملة كالفعل والاسم والمفعول به وأدوات الجر والأسماء المجرورة ومختلف الأدوات (إلاّ، إنَّ،....).
إن تحديد الفاعل من شأنه خلق صعوبات، الأمر الذي يقودنا إلى تكرار العملية مرات عديدة. فالإشكال الكبير الذي يستوجب حلا فعالا هو فك الترابط الموجود بين مختلف العناصر المكونة للتعبير أو الجملة لفهم مدلولها؛ فعلى سبيل المثال لا الحصر هناك الضمائر التي يجب أن تتوافق مع الأسماء التي تكون محلها وهذا حتى في الجمل التابعة للجملة الأصلية، كجمل الصلة والموصول.
مـــثال:
قَدَّمَت زينب هديّة قيِّمَة لِصديقتها ففرحت بـِهَا كثيرا*
فالضمير المتصل (ها) المسبوق بأداة الجر (بـ) تأتي محل كلمة (الهدية) في الجملة الأولى وهنا نلاحظ الارتباط بين الجملة الأولى والجملة اللاحقة حيث يتواجد فيها الضمير. فالغموض كثيرا ما يكون تتابعي مما ينعكس سلبا على المعنى الدلالي للجملة.
مـــثال:
قاعدة البيانات النحوية* فكلمة (النحوية) غير المشكلة من شأنها أن تحدث نوعا من الغموض في معنى الجملة؛ فهي بهذا الشكل (أي بدون تشكيل) يمكن أن تعود إلى (القاعدة) ولكن عند تشكيلها وإضافة الكسرة في آخرها يتبين محلها من الإعراب وتصبح مضافة بالجر إلى (البيانات).
í قَاعِدَةُ البياناتِ النَّحَوِيَّةِ.
í قَاعِدَةُ البيانَاتِ النَّحَوِيَّةُ.
µ مستوى التحليل الدلالي :
تُولي الكثير من برمجيات وأنظمة الترجمة الآلية اهتماما خاصا للتحليل الصرفي والنحوي للجمل المراد ترجمتها دون التحليل الدلالي الذي كان من آخر الأمور التي يفكر فيه، ولكن لأهميته البالغة في عملية الترجمة، بدأ في الآونة الأخيرة يأخذ حيزا من الاهتمام. وبغرض سد هذه الفجوة، أي في مجال التحليل الدلالي، قمنا بتطوير نظام "الناقل العربي" البرنامج الأول من نوعه الذي يتيح حلولا مناسبة للمشاكل والعوائق المتعلقة بالتحليل الدلالي.
تعتبر الجملة، كما هو معروف، مجموعة من الكلمات المعبرة عن فكرة ما وتحمل معنىً كاملاً، سواء تكونت من جملة واحدة أم من مجموعة من الجمل الثانوية؛ حيث يمكنها أن تكون رئيسية أو ثانوية أو مستقلة، أي جملة الصلة أو جملة الموصول والعامل المشترك بينها هو ارتباطها بفعل واحد. فأثناء عملية الترجمة يقوم البرنامج بتحديد الطبيعة والوظيفة النحوية لكل العناصر المكونة للجملة وكذا وظيفة الجمل المشكلة لها ثم يعاد تنظيم الوظائف النحوية حسب المدلول اللغوي: المسند والمسند إليه... أما عن المفردات متعددة المعاني فيتم تثبيت معناها وفقا لمضمون النص الذي يحتويها.
فلنأخذ على سبيل المثال المفردتين "سَلَّمَ" و"أعْطى"؛ حيث أن معناهما يتغير بحسب الأدوات المستعملة معها سواء الظرفية أم الجزم أم الجر ووضعيتها داخل الجملة.
سَلَّمَ على = salute s.o
سَلَّمَ بِـ = admit .s.th
سَلَّمَ أَمْرُهُ إلى = etc commit one's cause to ....
أَعْطَى فلاناً الشَّيءَ = give s.th. to s.o.
أَعْطَى دُرُوسا = give lessons
أَعْطَى لَهُ اْلكَِلِِِِِِمَة = s.o to speak allow
أَعْطى مَثَلاً = set an example
فهذا التحليل يأخذ بعين الاعتبار القواعد اللغوية والمفردات متعددة المعاني، أما فيما يخص التعبيرات الاصطلاحية الخاصة بثقافة معينة، كالتعبير الآتي:
"ذَهَبوا جَذَعَ مَذَعَ"
"وَقَعَ في حِيصَ بِيصَ"
فإنه من شأنه خلق نوعين من المشكلات :
í الأول يخص تحديد التعبير الاصطلاحي؛ لأن معناها يمثل وحدة موضوعية واحدة على الرغم من أنها متكونة من مفردات عديدة.
í الثاني هو فيما يخص معنى التعبير الاصطلاحي؛ فكلمة "حيص" مثلا تحمل معنيين؛ الأول ظاهر والثاني مجازي؛ في هذه الحالة يقوم برنامج الناقل العربي على تضييق بداية ونهاية التعبير الاصطلاحي ثم يختار المعنى الاصطلاحي الخاص بثقافة اللغة المترجم إليها.
µ مستوى التحويلات :
جملة التحويل مركبة من وظيفتين : التحويل النحوي والتحويل البنيوي؛ فكل جملة ممثلة بشجرة والتي ستحول بدورها إلى اللغة المترجم إليها (لغة الهدف)؛ وتلعب الوظيفة الأخيرة أهمية كبيرة، خاصة في اللغة الإنجليزية، حيث يكون موقع الفعل دائما بعد الفاعل.
مـــثال:
اللَّوحةَ الفنَّانُ رَسَمَ - The artist drew the painting
وأن الفعل المساعد (to be) مستعمل لإعراب الجمل الاسمية.
مـــثال:
ِللْمِِِعْرِِفةِ مُتَعَطِّشٌ دائماً الرَّجُلُ - The man is always thirsting for knowledge
µ مسـتوى التولـيد :
تعتبر مرحلة التوليد عند عملية الترجمة مرحلة متناسقة ومطابقة لمرحلة التحليل؛ فعمليات التحليل الصرفية والنحوية والدلالية تجرى بطريقة عكسية؛ لأن البنية النحوية لمجملة نص المصدر تكون ممثلة بشجرة وكل شجرة في اللغة المصدر تقابلها شجرة من اللغة الهدف، ثم بعد ذلك يقوم البرنامج بالتحويلات الصرفية والنحوية والتي تجرى بالتوازي؛ إلا أن الحدود الفاصلة بين المرحلتين السابقتين تبقى متمايزة؛ وفي هذا الخضم يعمل البرنامج على وضع الروابط النحوية (بتغيير مواقع ومواضع المفردات) والروابط الصرفية للأفعال (الإعراب) وبالتالي يكون التوليد الصرفي.
¹ طريــقة العمــل :
يعمل نظام الترجمة الآلية متعدد اللغات على شكل mode bath أو على الخط المباشر (الترجمة التفاعلية).
í mode bath : يخزن النص المترجم في ملف مستقل عن ملف الملف الأصلي.
í أما على الخط المباشر فإن النص المصدر ُيترجم جملة جملة ونتيجة الترجمة توضع في نافذة مستقلة تسمى "نص الهدف" توضع بدورها إلى جانب أو أسفل النص المصدر. هنا يتدخل المترجم لمراجعة الترجمة المقترحة من قبل البرنامج باستعمال فأرة الحاسوب فقط. تصنف الكلمات والمفردات غير المعروفة في لائحة داخل ملف على حدة، حيث يتم استخدامه من قبل المستعملين في تحيين وتحديث معجم المستعملين.
يعالج نظام الترجمة الآلية متعدد اللغات حوالي 90.000 كلمة في الساعة ويوفر ترجمة مفهومة ودقيقة، إلا أن الترجمة في الميدان اللغوي أبعد من أن تكون مرضية 100% ولكنها على قدر من الوضوح والقبول، تحتاج فقط إلى بعض التحسينات والتعديلات أثناء مرحلة المراجعة.
لقد سمح استعمال المحللين الصرفيين واللغويين في اللغتين الإنجليزية والفرنسية من تطوير برنامج آلي للترجمة متعدد اللغات يوفر ترجمة أولية تحتاج فقط إلى مرحلة مراجعة ما بعد النشر. لا يبقى إلا حل المشكل على المستوى النحوي والدلالي. وللوقوف على هذه السلبيات تم إعداد مقاربة جديدة ذات خصائص وميزات، حيث سيتم تطبيقها عاجلا.
يستعمل البرنامج خمسة معاجم على المرة و هي :
í المعجم العام (يحوي حوالي 100.000 مدخلا قاعديا) ينبثق منها أكثر من 5.000.000 كلمة.
í معجم الأفعال العربية (يحوي حوالي 17.000 مدخلا).
í المعاجم المتخصصة (الإعلام الآلي، الطب، اقتصاد ومالية، تجارة، طيران، ...).
í معجم الاصطلاحات التعبيرية (يحوي حوالي 3.000 مدخلا).
í معجم المستخدمين (الذي يضم كلمات ومفردات مضافة من قبل المستعملين أنفسهم).
الشـكل العـام
í حاسوب شخصي بانتيوم.
í الطبعة العربية: وينداوز 98 ، 2000، XP، أو وينداوز NT.
í 128 ميغا اوكتي للذاكرة.
í 150 إلى 200 ميغا اوكتي في القرص الصلب.
î Ordinateur individuel Pentium.
î Version arabe: Windows 98, 2000, XP, ou Windows NT.
î 128 Mo de RAM.
î 150 à 200 Mo de disque dur.
¹ الخاتــمة
لقد انصب اهتمام واختصاص شركةCIMOS منذ إنشائها في هندسة أدوات التعريب والبرمجة؛ ذلك أن التعريب يمثل خيارا حيويا للبلدان العربية، كما أنه يغطي مجالات نشاط متعددة يجمع بين الترجمة والتكيف التكنولوجي. في البداية تم انجاز وتطوير برنامج الترجمة "الناقل العربي" وهو اليوم حقيقة ملموسة بعدما كان حلما؛ وهو برنامج مساعد في الترجمة، يوفر على المترجمين جهودا كبيرة ويساعدهم في أداء مهامهم اليومية في ميدان الترجمة. ذلك أنه من المؤكد أن كل محترف وكل ممارس يستخدم أدوات عصره؛ فالمهندس يستعمل الحاسوب لإجراء حساباته ورسم مخططاته والقيام باختباراته؛ فاستعمال الحاسوب من شأنه الرفع من مردود ونوعية العمل المراد القيام به.
إن استعمال الأدوات الآلية للمساعدة في عملية الترجمة لا يمكن إلا أن يزيد من نوعية الأعمال المترجمة؛ فالناقل العربي عبارة عن جهاز وأداة مساعدة للمترجم وفي عصر الانترنيت والاتصالات لا يمكن، بأي حال من الأحوال، تجاهل أداة عمل فعالة كالحاسوب لأن استعماله في ميدان الترجمة يعتبر أكثر من ضرورة.
كما تحتاج الترجمة كذلك إلى مصطلحات جديدة لإعداد المعاجم، وتزدهر أكثر عندما يكون المصطلح المعبر عن المفهوم مستعملا بصفة واسعة في المصنع والمخبر والبيت والشارع، كما أن ترجمة الكتب المتخصصة والمقالات التقنية والعلمية من شأنه أن يساهم في بث ونشر المصطلحات الجديدة وشيوع استعمالها اليومي؛ لذا وجب أن يكون اتصال دائم بين الباحث المنتج والمترجم والمختص في علم المصطلحات؛ ذلك أن التجربة بينت، من خلال استقراء تاريخ الإنسانية، خاصة خلال الحضارة العربية الإسلامية في الفترة العباسية خلال حكم الخليفة المأمون عند إنشائه لبيت الحكمة، كيف أن الترجمة لعبت دورا مهما في الازدهار الحضاري للأمم. ولنا في الدول المتقدمة (الولايات المتحدة الأمريكية، واليابان) خير دليل، حيث تنفق أموالا طائلة في عملية الترجمة، كما أن التجارب القديمة والحديثة تمثل خير قدوة للبلدان العربية خاصة في الميدان التقني والعلمي للقرن الواحد والعشرين.
قامت شركة CIMOS منذ تأسيسها بدمج نشاطاتها المتعلقة بالترجمة التقليدية وذلك بتطوير برامج متعددة اللغات. كانت الترجمة تنجز بطريقة يدوية، من العربية إلى اللغات الأوروبية الحية والعكس، من طرف مترجمين ذوي تكوين في الإعلام الآلي. أما فيما يخص برامج الترجمة فقد كانت تُطور من قبل مهندسين ذوي مؤهلات لغوية معتبرة ويقوم لغويون محترفون بمساعدتهم في ذلك. تحوي هذه البرامج على مسارات شاملة تأخذ بعين الاعتبار التحليل الصرفي والنحوي والدلالي لفهم نص المصدر قبل ترجمته.
فخلال السنوات الماضية كان زبائننا يقدمون لمترجمينا وثائق مهمة تتمثل في كتب الصيانة وأدلة المستعملين. وأمام الطلبات المتزايدة قررنا تألية ومكننة مسار نشاط الترجمة لاحتياجاتنا أولا واحتياجات زبائننا ثانيا، فعمدنا بذلك إلى إنشاء دائرة "الفهم الآلي للنصوص وأدوات المساعدة في الترجمة" على مستوى المؤسسة لغرض مساعدة المترجمين في عملهم وتطوير مسار نشاط الترجمة التقليدية إلى نظام الترجمة الآلية. للإشارة فإن تصميم وتشغيل هذه البرامج يقوم على نظريات القواعد اللغوية واللسانية.
لقد تم تطوير نظام الترجمة الآلية متعدد اللغات MLTS في دائرة الفهم الآلي للنصوص بالشركة والتي قامت منذ حوالي خمسة عشر سنة بجمع مصادر معجمية متنوعة (قائمة يتم تحديثها باستمرار) وهي بمثابة أداة مساعدة للمترجمين وقاعدة بيانات لبرامج الترجمة الآلية. ومنذ ذلك الحين قامت شركةCIMOS بإنجاز وتطوير مجموعة من البرامج في مجال الترجمة الآلية؛ نذكر على سبيل المثال: الناقل العربي الذي يتوفر في طبعات متعددة إنجليزي- عربي /عربي - إنجليزي، فرنسي - عربي/ عربي - فرنسي (الطبعة 3.0 في نهاية 2002).
¹ عـرض الـبرنـامــج :
قام بتطوير نظام الترجمة الآلية متعدد اللغات مجموعة من اللغويين والمهندسين ذوي خبرة عالية ومترجمين محترفين؛ فهو نظام خاص بالترجمة الآلية صُمم أساسا لمساعدة المترجمين وليس لتعويضهم في أداء وظيفتهم، فهو بإمكانه إعطاء محاولة أولية لترجمة مفهومة ومقبولة، كما يقوم بترجمة النصوص من مختلف الميادين (التجارة، الاقتصاد والمال، الإعلام لآلي...) بالاعتماد على معاجم لغوية متخصصة وعامة.
يعمل نظام الترجمة الآلية متعدد اللغات (MLTS) على خمسة مستويات مختلفة وهي :
í مستوى قاعدة النصوص المترجمة.
í مستوى التحليل الصرفي.
í مستوى التحليل النحوي.
í مستوى التحليل الدلالي.
í مستوى التحويلات (اللغة الرئيسية).
يقوم بتنسيق مقترحات قاعدة النصوص المترجمة وموضوع الترجمة بالتحويلات. فهو يعتمد على الوحدات الدلالية وعلى التمثيل الداخلي لمفاهيم اللغة.
µ مستوى قاعدة النصوص المترجمة :
عند البدء في عملية الترجمة يقوم البرنامج بالبحث أولا في قاعدة النصوص المترجمة على جملة مشابهة للجملة المراد ترجمتها ثم يبدأ بعدها باستعمال تقنيات الرص والتصفيف والفرز التقريبي (Fuzzy matching)، فإذا كانت نسبة المقاربة 100 % فهي مساواة بين سلسلتين من الحروف، أما إذا كانت النسبة أدنى من ذلك فهي جملة باختلافات طفيفة (تحتاج إلى تغيير مواقع الأسماء والأفعال والصفات أكثر منه إعراب أفعال...).
ففي هذا الصدد تقترح قاعدة النصوص المترجمة جمل تبادلية متقاربة ومتطابقة (Fuzzy matching)، حيث أنه بإمكان البرنامج القيام بتغييرات وتبديلات لأجزاء مختلفة من الجملة أو العبارة (مثل الأرقام، أسماء الأعلام) وحتى بتغيير وتحوير أجزاء مختلفة إن تطلب الأمر ذلك؛ وبهذا تصبح نتائج الترجمة الآلية حقلا كامنا عن طريقه يمكن تغذية قاعدة النصوص المترجمة، ولكن من شأن هذه الطريقة إعياء القاعدة بصفة سريعة وإطالة مدة البحث؛ ولهذا فإننا مطالبون بتطوير طرق جديدة للتصفيف والترتيب والفرز والضغط.
فعلى سبيل المثال عند ترجمة الجملة الإنجليزية "To give something to somebody"؛ علينا معرفة القيام بالتغييرات والتبديلات المناسبة حسب موضوع الحال.
أمـــثلة :
í تكتب البنت الرسالة The girl writes the letter
í يكتب الصحفي المشهور المقال The famous journalist writes the article
í عند الرجل كتاب The man has a book
í عند الرجل كتاب جيد The man has a good book
تصنف الكلمتان "the girl" و "Journalist" في نفس المجموعة، نفس الشيء مع الكلمتين "letter" و"Article"، ولهذا فإنه على مستوى قاعدة النصوص المترجمة تكون الجملتان متقاربتين ومخزنتين على شكل واحد.
µ مستوى التحليل الصرفي :
يقوم البرنامج بتحليل كل كلمة من الجملة على حدا لكي يستخلص سماتها الصرفية والنحوية (الإعراب، الجنس، العدد....). ثم يعمد إلى وضع مختلف الفرضيات على الشكل التالي:
í وضع الأسماء على الشكل المثنى.
í وضع الأفعال على صيغة المصدر.
í وضع الصفات على شكل المذكر المفرد.
í وضع الاصطلاحات التعبيرية الخاصة بثقافة معينة على الصيغة المصدرية مصرفة مع ضمير المخاطب الغائب ثم يقوم بعدها بالبحث على السلسلة الأكثر طولا بالمقارنة مع العناصر المخزنة في المجموعة المعجمية التالية :
é معجم عام يحتوي على الكلمات المألوفة.
é معجم المصطلحات يحتوي على اصطلاحات تعبيرية خاصة بثقافة اللغة المترجم إليها.
é معجم متخصص يحتوي على كلمات خاصة بميدان معين.
é معجم المستخدم يحتوي على الكلمات المضافة والمعدلة من قبل المستعملين.
و بهذا يوضع عنصر من العناصر المكونة للجملة في مجموعة لغوية "كلمات بسيطة" أو "كلمات مركبة" أو "اصطلاحات تعبيرية".
مــثال:
لتكن الجملة التالية من القرآن الكريم: "فسيكفيكهم الله".
فالبرنامج يقوم بتفكيكها في المرحلة الأولى إلى الشكل التالي: الله+هم+ك+سيكفي+ف، ثم ينتقل إلى تفكيك ثانٍٍٍ تتحصل من خلاله على الشكل التالي: الله+هم+ك+ي+س+ف.
في بعض الأحيان يمكن أن يكون لنفس الكلمة احتمالات عديدة بمجموعات مختلفة؛ فهذا النوع من الغموض كثيرا ما نصادفه، إلا أن هناك إجراءات من شأنها رفعه وإزالته. فكثيرا ما تكتب اللغة العربية بدون استعمال التشكيل كالهمزة والشدة؛ الشيء الذي يخلق صعوبات معتبرة في فهم المفردات.
í فكلمة "علم" يمكن أن تعني:. عُلِمَ، عَلَمٌ، عَلَّمَ، عِلْم، عَلِمَ.
í وكلمة "فهم" يمكن أن تعني:. فَهِمَ، فَهْم، فَهَمَّ، فَهُمْ، فَهَّمَ
í وكلمة "دين" يمكن أن تعني: دَيْنٌ، دِيْنٌ.
í ولإزالة الغموض على هذه الكلمات نقوم بتشكيلها.
í نفس الشيء مع كلمة "كل" يمكن أن تعني كَلَّ، كُلْ، كُلَّ فعند إضافة الشدة يمكن التفريق بينها.
í وكذا مع الكلمة "سال" التي يمكن أن تعني سَأَلَ، سَالَ فللتفريق بينها تضاف إليها الهمزة.
µ مستوى التحليل النحوي :
في هذا المستوى يحلل البرنامج بنية الجملة لمعرفة المجموعة النحوية لمختلف العناصر المكونة لها، ثم يقوم بعد ذلك بالتأكد من أن البنية المتحصل عليها مطابقة للقواعد النحوية للغة المترجم إليها. يقوم البرنامج بعدها بتحليل كل مجموعات العناصر التي تتركب منها الجملة كالفعل والاسم والمفعول فيه ومختلف الأدوات الإعرابية كأدوات الجر والجزم والعطف والأسماء المجرورة وأسماء الصلة والموصول الخ ... ؛ فهو بهذا الإجراء يحدد مختلف وحدات التعبير في الجملة ويقوم بوضع روابط دلالية بين مختلف هذه التراكيب والمجموعات.
يُحدد التحليل النحوي ابتداء من العناصر التي تم وضعها في المجموعات المكونة للجملة كالفعل والاسم والمفعول به وأدوات الجر والأسماء المجرورة ومختلف الأدوات (إلاّ، إنَّ،....).
إن تحديد الفاعل من شأنه خلق صعوبات، الأمر الذي يقودنا إلى تكرار العملية مرات عديدة. فالإشكال الكبير الذي يستوجب حلا فعالا هو فك الترابط الموجود بين مختلف العناصر المكونة للتعبير أو الجملة لفهم مدلولها؛ فعلى سبيل المثال لا الحصر هناك الضمائر التي يجب أن تتوافق مع الأسماء التي تكون محلها وهذا حتى في الجمل التابعة للجملة الأصلية، كجمل الصلة والموصول.
مـــثال:
قَدَّمَت زينب هديّة قيِّمَة لِصديقتها ففرحت بـِهَا كثيرا*
فالضمير المتصل (ها) المسبوق بأداة الجر (بـ) تأتي محل كلمة (الهدية) في الجملة الأولى وهنا نلاحظ الارتباط بين الجملة الأولى والجملة اللاحقة حيث يتواجد فيها الضمير. فالغموض كثيرا ما يكون تتابعي مما ينعكس سلبا على المعنى الدلالي للجملة.
مـــثال:
قاعدة البيانات النحوية* فكلمة (النحوية) غير المشكلة من شأنها أن تحدث نوعا من الغموض في معنى الجملة؛ فهي بهذا الشكل (أي بدون تشكيل) يمكن أن تعود إلى (القاعدة) ولكن عند تشكيلها وإضافة الكسرة في آخرها يتبين محلها من الإعراب وتصبح مضافة بالجر إلى (البيانات).
í قَاعِدَةُ البياناتِ النَّحَوِيَّةِ.
í قَاعِدَةُ البيانَاتِ النَّحَوِيَّةُ.
µ مستوى التحليل الدلالي :
تُولي الكثير من برمجيات وأنظمة الترجمة الآلية اهتماما خاصا للتحليل الصرفي والنحوي للجمل المراد ترجمتها دون التحليل الدلالي الذي كان من آخر الأمور التي يفكر فيه، ولكن لأهميته البالغة في عملية الترجمة، بدأ في الآونة الأخيرة يأخذ حيزا من الاهتمام. وبغرض سد هذه الفجوة، أي في مجال التحليل الدلالي، قمنا بتطوير نظام "الناقل العربي" البرنامج الأول من نوعه الذي يتيح حلولا مناسبة للمشاكل والعوائق المتعلقة بالتحليل الدلالي.
تعتبر الجملة، كما هو معروف، مجموعة من الكلمات المعبرة عن فكرة ما وتحمل معنىً كاملاً، سواء تكونت من جملة واحدة أم من مجموعة من الجمل الثانوية؛ حيث يمكنها أن تكون رئيسية أو ثانوية أو مستقلة، أي جملة الصلة أو جملة الموصول والعامل المشترك بينها هو ارتباطها بفعل واحد. فأثناء عملية الترجمة يقوم البرنامج بتحديد الطبيعة والوظيفة النحوية لكل العناصر المكونة للجملة وكذا وظيفة الجمل المشكلة لها ثم يعاد تنظيم الوظائف النحوية حسب المدلول اللغوي: المسند والمسند إليه... أما عن المفردات متعددة المعاني فيتم تثبيت معناها وفقا لمضمون النص الذي يحتويها.
فلنأخذ على سبيل المثال المفردتين "سَلَّمَ" و"أعْطى"؛ حيث أن معناهما يتغير بحسب الأدوات المستعملة معها سواء الظرفية أم الجزم أم الجر ووضعيتها داخل الجملة.
سَلَّمَ على = salute s.o
سَلَّمَ بِـ = admit .s.th
سَلَّمَ أَمْرُهُ إلى = etc commit one's cause to ....
أَعْطَى فلاناً الشَّيءَ = give s.th. to s.o.
أَعْطَى دُرُوسا = give lessons
أَعْطَى لَهُ اْلكَِلِِِِِِمَة = s.o to speak allow
أَعْطى مَثَلاً = set an example
فهذا التحليل يأخذ بعين الاعتبار القواعد اللغوية والمفردات متعددة المعاني، أما فيما يخص التعبيرات الاصطلاحية الخاصة بثقافة معينة، كالتعبير الآتي:
"ذَهَبوا جَذَعَ مَذَعَ"
"وَقَعَ في حِيصَ بِيصَ"
فإنه من شأنه خلق نوعين من المشكلات :
í الأول يخص تحديد التعبير الاصطلاحي؛ لأن معناها يمثل وحدة موضوعية واحدة على الرغم من أنها متكونة من مفردات عديدة.
í الثاني هو فيما يخص معنى التعبير الاصطلاحي؛ فكلمة "حيص" مثلا تحمل معنيين؛ الأول ظاهر والثاني مجازي؛ في هذه الحالة يقوم برنامج الناقل العربي على تضييق بداية ونهاية التعبير الاصطلاحي ثم يختار المعنى الاصطلاحي الخاص بثقافة اللغة المترجم إليها.
µ مستوى التحويلات :
جملة التحويل مركبة من وظيفتين : التحويل النحوي والتحويل البنيوي؛ فكل جملة ممثلة بشجرة والتي ستحول بدورها إلى اللغة المترجم إليها (لغة الهدف)؛ وتلعب الوظيفة الأخيرة أهمية كبيرة، خاصة في اللغة الإنجليزية، حيث يكون موقع الفعل دائما بعد الفاعل.
مـــثال:
اللَّوحةَ الفنَّانُ رَسَمَ - The artist drew the painting
وأن الفعل المساعد (to be) مستعمل لإعراب الجمل الاسمية.
مـــثال:
ِللْمِِِعْرِِفةِ مُتَعَطِّشٌ دائماً الرَّجُلُ - The man is always thirsting for knowledge
µ مسـتوى التولـيد :
تعتبر مرحلة التوليد عند عملية الترجمة مرحلة متناسقة ومطابقة لمرحلة التحليل؛ فعمليات التحليل الصرفية والنحوية والدلالية تجرى بطريقة عكسية؛ لأن البنية النحوية لمجملة نص المصدر تكون ممثلة بشجرة وكل شجرة في اللغة المصدر تقابلها شجرة من اللغة الهدف، ثم بعد ذلك يقوم البرنامج بالتحويلات الصرفية والنحوية والتي تجرى بالتوازي؛ إلا أن الحدود الفاصلة بين المرحلتين السابقتين تبقى متمايزة؛ وفي هذا الخضم يعمل البرنامج على وضع الروابط النحوية (بتغيير مواقع ومواضع المفردات) والروابط الصرفية للأفعال (الإعراب) وبالتالي يكون التوليد الصرفي.
¹ طريــقة العمــل :
يعمل نظام الترجمة الآلية متعدد اللغات على شكل mode bath أو على الخط المباشر (الترجمة التفاعلية).
í mode bath : يخزن النص المترجم في ملف مستقل عن ملف الملف الأصلي.
í أما على الخط المباشر فإن النص المصدر ُيترجم جملة جملة ونتيجة الترجمة توضع في نافذة مستقلة تسمى "نص الهدف" توضع بدورها إلى جانب أو أسفل النص المصدر. هنا يتدخل المترجم لمراجعة الترجمة المقترحة من قبل البرنامج باستعمال فأرة الحاسوب فقط. تصنف الكلمات والمفردات غير المعروفة في لائحة داخل ملف على حدة، حيث يتم استخدامه من قبل المستعملين في تحيين وتحديث معجم المستعملين.
يعالج نظام الترجمة الآلية متعدد اللغات حوالي 90.000 كلمة في الساعة ويوفر ترجمة مفهومة ودقيقة، إلا أن الترجمة في الميدان اللغوي أبعد من أن تكون مرضية 100% ولكنها على قدر من الوضوح والقبول، تحتاج فقط إلى بعض التحسينات والتعديلات أثناء مرحلة المراجعة.
لقد سمح استعمال المحللين الصرفيين واللغويين في اللغتين الإنجليزية والفرنسية من تطوير برنامج آلي للترجمة متعدد اللغات يوفر ترجمة أولية تحتاج فقط إلى مرحلة مراجعة ما بعد النشر. لا يبقى إلا حل المشكل على المستوى النحوي والدلالي. وللوقوف على هذه السلبيات تم إعداد مقاربة جديدة ذات خصائص وميزات، حيث سيتم تطبيقها عاجلا.
يستعمل البرنامج خمسة معاجم على المرة و هي :
í المعجم العام (يحوي حوالي 100.000 مدخلا قاعديا) ينبثق منها أكثر من 5.000.000 كلمة.
í معجم الأفعال العربية (يحوي حوالي 17.000 مدخلا).
í المعاجم المتخصصة (الإعلام الآلي، الطب، اقتصاد ومالية، تجارة، طيران، ...).
í معجم الاصطلاحات التعبيرية (يحوي حوالي 3.000 مدخلا).
í معجم المستخدمين (الذي يضم كلمات ومفردات مضافة من قبل المستعملين أنفسهم).
الشـكل العـام
í حاسوب شخصي بانتيوم.
í الطبعة العربية: وينداوز 98 ، 2000، XP، أو وينداوز NT.
í 128 ميغا اوكتي للذاكرة.
í 150 إلى 200 ميغا اوكتي في القرص الصلب.
î Ordinateur individuel Pentium.
î Version arabe: Windows 98, 2000, XP, ou Windows NT.
î 128 Mo de RAM.
î 150 à 200 Mo de disque dur.
¹ الخاتــمة
لقد انصب اهتمام واختصاص شركةCIMOS منذ إنشائها في هندسة أدوات التعريب والبرمجة؛ ذلك أن التعريب يمثل خيارا حيويا للبلدان العربية، كما أنه يغطي مجالات نشاط متعددة يجمع بين الترجمة والتكيف التكنولوجي. في البداية تم انجاز وتطوير برنامج الترجمة "الناقل العربي" وهو اليوم حقيقة ملموسة بعدما كان حلما؛ وهو برنامج مساعد في الترجمة، يوفر على المترجمين جهودا كبيرة ويساعدهم في أداء مهامهم اليومية في ميدان الترجمة. ذلك أنه من المؤكد أن كل محترف وكل ممارس يستخدم أدوات عصره؛ فالمهندس يستعمل الحاسوب لإجراء حساباته ورسم مخططاته والقيام باختباراته؛ فاستعمال الحاسوب من شأنه الرفع من مردود ونوعية العمل المراد القيام به.
إن استعمال الأدوات الآلية للمساعدة في عملية الترجمة لا يمكن إلا أن يزيد من نوعية الأعمال المترجمة؛ فالناقل العربي عبارة عن جهاز وأداة مساعدة للمترجم وفي عصر الانترنيت والاتصالات لا يمكن، بأي حال من الأحوال، تجاهل أداة عمل فعالة كالحاسوب لأن استعماله في ميدان الترجمة يعتبر أكثر من ضرورة.
كما تحتاج الترجمة كذلك إلى مصطلحات جديدة لإعداد المعاجم، وتزدهر أكثر عندما يكون المصطلح المعبر عن المفهوم مستعملا بصفة واسعة في المصنع والمخبر والبيت والشارع، كما أن ترجمة الكتب المتخصصة والمقالات التقنية والعلمية من شأنه أن يساهم في بث ونشر المصطلحات الجديدة وشيوع استعمالها اليومي؛ لذا وجب أن يكون اتصال دائم بين الباحث المنتج والمترجم والمختص في علم المصطلحات؛ ذلك أن التجربة بينت، من خلال استقراء تاريخ الإنسانية، خاصة خلال الحضارة العربية الإسلامية في الفترة العباسية خلال حكم الخليفة المأمون عند إنشائه لبيت الحكمة، كيف أن الترجمة لعبت دورا مهما في الازدهار الحضاري للأمم. ولنا في الدول المتقدمة (الولايات المتحدة الأمريكية، واليابان) خير دليل، حيث تنفق أموالا طائلة في عملية الترجمة، كما أن التجارب القديمة والحديثة تمثل خير قدوة للبلدان العربية خاصة في الميدان التقني والعلمي للقرن الواحد والعشرين.
ترجم من طرف :
شركة كليك لخدمات الحاسوب
شركة كليك لخدمات الحاسوب
Aucun commentaire:
Enregistrer un commentaire