|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
حيا الله الباشمهندس حاتم، وشكراً لهذا المجهود الكبير، وحقيقةً أنا من المهتمين بهذا الأمر، لكن من باب اهتمامي بالنحو فقط، وعندي ملحوظة، وهي أنّ هذا التصريف، المستعمل في هذا البرنامج ليس تصريفاً للأفعال العربية فقط! إنما يبدو لي تصريفاً للجملة الفعلية في أحوالها المختلفة، بالذات من ناحية اقترانها بالضمائر، ابتداءً من ضمائر الرفع، ثم ضمائر النصب والجر! ما رأيك؟ عموماً تجدني مترقّباً اكتمال هذا العمل.
| |
|
|
|
|
|
|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
تقوم اللغة العربية صرفاً وإملاء على مبدأ الاشتقاق (Inflection) بالبناء على الجذر، وهي تشترك في هذه الميزة مع بقية لغات العائلة السامية (الآرامية والعبرية) والأفريقية السامية (التغرينيا والأمهرية)، كل جذر ثلاثي صحيح يمكن أن يشتق منه حوالي 30 ألف مفردة نظرياً يمكن توليد معظم هذه المفردات باستخدام أدوات برمجية مثل برنامج تصريف الأفعال أعلاه إضافة لبرنامج اشتقاق الأسماء (يأتي قريباً)، هذا بالحساب يعني أن فضاء اللغة العربية يحوي حوالي 180 مليون مفردة وذلك بأخذ الجذور النشطة في اللغة العربية المعاصرة 6000 جذر.
لسوء الحظ، هذا الغنى في الألفاظ مع اتساع الرقعة الجغرافية لانتشار اللغة أفرز ما تعانيه من ميل صرفي (Lexical Bias) وهو تفضيل صيغ صرفية محددة على غيرها، فمثلاً الشائع في اللغة استخدام مفردة "محطَّم" وليس "محطوم" رغماً عن صحتها لغوياً ومناسبتها للوصف فهي اسم مفعول مثل (مهزوم)، ويستخدم البعض اللفظ "مربوح" وهو نادر إلا في المغرب العربي، يذكر الكاتب أنه سمع لفظ “مربوحة” أول مرة يوم مبارة الزائر مع مصر في أم درمان عند مقدم مشجعي الفريق الجزائري، يقصدون أنهم فائزون بالمبارة لا محالة، هذا ما لا يقولونه في المشرق.
لذا فإن فرط توليد المفردات قد لا يكون ميزة إيجابية إذا لم يتفق الناس على كيفية الاستفادة منه، فلا يمكن تعميم القالب الصرفي “الميزان” على أي مفردة، إذن لحصلنا على كلمات تبدو (غريبة) للبعض مثل “مرغوم، كاسور، جابن، مخواف، كواذب، زبناء، رابوط، ضوارب، شبيع” وهي كلمات عربية ربما لم تسمع بها في منطقتك. الميل الصرفي (Lexical Bias) مصطلح جديد يقترحه الكاتب للتحقيق في ظاهرة التفضيل الإملائي لمفردات ذوات صيغ صرفية محددة وقياس ذلك.
كان يمكن أن يقدم الجذر خدمة عظيمة للغة لو كانت مشتقاته تتفق كلها دلالياً لكن للأسف هذا لا ينطبق إلا على فئة محدودة من الجذور، مبدأ الوحدة الدلالية (ٍSemantic Consistency) مصطلح لمعيار جديد من اقتراح الكاتب وهو يوظف الدلالة التكوينية (Ontology) وله قياسات حسابية كمية تستعملها المصنفات (PoSTagger) ويختلف عن الترادف (Synonymy) الذي يبحث في مطابقة المعنى أو التناظر الإملائي (homonyms) الذي يبحث في تباين المعنى مثل (درس التمليذ الواجب) و (درس الحمار الشعير).
اللغة العربية تتصف بالتشظي الدلالي (Semantic Dispersion) أو التشتت الدلالي الذي يحسب ثراءاً بلاغياً في اللغة لكنه ليس في مصلحة أي تطبيق لمعالجة النصوص بأسلوب منطقي يستقي مقدماته من اتساق معاني المفردات المشتقة من أصل وحيد، وهو مصطلح جديد لمعيار يقترحه الكاتب لقياس التباعد الدلالي بين المفردات من أصل واحد، ويتم التعبير عنه بقيمة بين الصفر والواحد، حيث الصفر يعبر عن الوحدة الدلالية لكل المفردات ذوات الصيغة الإملائية المشتقة من الجذر الواحد، فإن كانت ذات معامل تشتت كبير فهي إذن مختلفة الدلالات ولن يصلح الأمر إلا بتوليد كل المفردات المحتملة للجذر ومضاهاتها بمقابلاتها في اللغة المستهدفة.
عملية توليد كل الاشتقاقات تنتج ما يعرف بالقاموس التام (Full Form Dictionary) وهي المشكلة التي أشرنا إليها سابقاً إذ أن توليد 30 ألف مفردة لا يتطلب شيئاً يذكر في الكمبيوترات الحديثة من ناحية الحفظ في الذاكرة ولكنها تسبب تأخيراً بائناً إذا وجب توليدها ضمن برنامج تنسيق نصوص لدعم ميزة التصحيح الإملائي مثلاً، كذلك وجود هذا الكم الكبير من المفردات بلا رابط يجمعها دلالياً لا فائدة منطقية ترجى منه.
التشتت الدلالي مشكلة باقية (Persistent) من أصل اللغة أي أنها غير ذات ارتباط بالعصور المختلفة لتطور اللغة ومدى تداخلها المعاصر مع التطور الحياتي البشري الذي يسبب انزياح المعنى، فمصطلحات معاصرة مثل (عربة، حافلة، سيارة) لا يجوز التسرع في الحكم بمدلولاتها بمعزل عن السياق الزمني للنصوص التي وردت فيها فهي "معروفة" اليوم ولكن لها دلالاتها المختلفة إذا جاءت ضمن نصوص أدبية قديمة كما في الشعر الجاهلي فكلمة (حافلة) آنذاك لم تكن أبداً مركبة تسير على أربع أو ست عجلات، هذا يسمى انزياح المعنى (Semantic Shift)، ولكن اللغة العربية أصلاً تفتقر للوحدة الدلالية فحتى مفردات شائعة مثل “ضرب” والتي تنتمي لذات الجذر مع أخريات (ضَرْب، ضريب، مضارب، ضِراب، ضُروب، إضراب) لا تسلم من هذه المشكلة بدون أن نتطرق حتى لدلالاتها المعاصرة.
الأمر الجيد أن في اللغة العربية متسع من هذه الحيل، والأمر ليس كله سوء، فلو تتبعنا النواتج غير المستخدمة من فضْلات تطبيق النظام الصرفي لأمكن حل مشاكل عديدة في الترجمة أولها إيجاد مقابلات للمفردات الحديثة الوافدة من اللغات الأخرى والتي أوفرها ما يستخدم في الحاجات الأساسية للبشر حيث تختلف الأسماء بسبب أن مسمياتها غالباً ما تنتشر جغرافياً في ذات الوقت، الميل الصرفي لا علاقة له بالترادف، الإنجليز مثلاً يستخدمون المصطلحات (Lift, Petrol, Tube) لتسمية المصعد والوقود وقطار الأنفاق بينما الأمريكان يقولون (Elevator, Gas, Subway) لذات المسميات، الحل باستخدام حلول معجمية فالأسماء مجالها واسع ولا يوجد غير الحل المعجمي.
نقلاً عن موضوع سابق http://sudaneseonline.com/board/470/msg/1408906921.html
| |
|
|
|
|
|
|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
Quote: عندي ملحوظة، وهي أنّ هذا التصريف، المستعمل في هذا البرنامج ليس تصريفاً للأفعال العربية فقط! إنما يبدو لي تصريفاً للجملة الفعلية في أحوالها المختلفة، بالذات من ناحية اقترانها بالضمائر، ابتداءً من ضمائر الرفع، ثم ضمائر النصب والجر! ما رأيك؟ |
المصرف التام | مرحبا أستاذ عباس فقير
ليست الضمائر وغيرها من الطرفيات (arguments) بل كل فئات الفعل (grammatical classes) وأبنيته وأزمنته، ببساطة هو يقوم بتوليد اللغة العربية المنظومة، هنالك برنامج لاشتقاق الاسماء أيضاً ربما يأتي بعض أسبوعين. الغرض: تجهيز المكانز (corpora) لأهداف متعددة ومتنوعة لاستخدامها في الترجمة الآلية بالتعرف على ميزات اللغة الإملائية ثم وصولاً إلى مسائل أعمق تتعلق بالدلالة التكوينية، أرجو مطالعة موضوع سابق هنا http://sudaneseonline.com/board/470/msg/1408906921.html
فبخلاف المصرفات التقليدية المتوفرة التي تعمل على تصريف الفعل في حالته الأولية (أي مسنداً إلى المفرد المذكر الغائب في صيغة المبني للمعلوم) فإن هذا المصرف يعمل على مبدأ التصريف التام أي توليد إضافة الضمائر وكل الزوائد التي من شأنها أن تعطي كل المفردات المتوفرة في اللغة، هذا هو الوضع الطبيعي لما يمكن أن توجد عليه تلك المفردات في النصوص المرسلة المعاصرة. كل هذا يمكن التحكم فيه من قبل المستخدم للبرنامج ولأدق التفاصيل المطلوبة ضمن القواعد الإملائية والنحوية للغة العربية كما يظهر في الصورة. وربما أغراض تعليمية، فأي متعلم سيجد مفردات مثل "درستموها" وليس "دَرَسَ" فقط. مرحباً بك، أعتقد أن تنزيل المصرف سيكون متاحاً بعد يومين.
|
| |
|
|
|
|
|
|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
شبه جاهز الآن | لمشكلة في منطق اختيار الفئات اللغوية ربما تظهر بعض النتائج غير منطقية يكفي اختيار الكل مرة واحدة فتظهر كل التصريفات، أكثر من 30،000 وتستغرق نصف دقيقة (في جهازي) أعمل على إجراء التعديلات، دائماً
دليل التثبيت عربي http://www.kalmasoft.com/support/DOCAMRLConj.pdf English http://www.kalmasoft.com/support/DOCMRLConj.pdfm
صفحة التنزيل عربي http://www.kalmasoft.com/KMAPS/aspmrlco.htm English http://www.kalmasoft.com/KMAPS/spmrlco.htm
|
| |
|
|
|
|
|
|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
اللغة العربية أغلب مفرداتها سماعية حتى مع صفة الاشتقاق شبه المنتظمة |
الجذر (كلم) يعطي فعلين كلَّم، يكلم تكليما كلَم، يُكْلِم كلما ولا سبيل لتمييز أيهما إلا سماعياً إذا أن الهيئة (فَعَّل) يجب أن لا تغير من دلالة الفعل إذا جاء بهيئة (فَعَلَ) (مثل: فرض-فرَّض). لغة غريبة
|
| |
|
|
|
|
|
|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
بالتوفيق يا باشمهندس، ولو في Beta أرسلها لينا..
أكبر همكم يكون في تبسيط التشغيل.. والقياس هو إفتراض عدم معرفة المستعمل أي شيء عن البرنامج.
في لغة البنى عامر ما زالت تستعمل كلمات مثل أكلاب جمع كلب، وأتافئ (الأحجار الثلاث اللائى يوضع فوقهن إناء الطبخ) وأبيوت جمع بيت
من ضمن كلمات العربية القديمة التي ما زال يستعملها البنى عامر في شرق السودان حالياً : 1- أبيات (جمع بيت) 2- دمنة (مخلفات السكن المهجور بعد رحيل أهله.. أقرب معنى حديث لها كوشـة) وجمعها أيضا دمن كما في العربية 3- حوار (صغير الإبل) 4- قلس (الفجر وتماثل كلمة غلس) 5- طروى (نى أو طرى) 6- حوية وجمعها حوى بضم الحاء وفتح الواو وسكون الياء (وهو جهاز مبطن بالقطن او الريش يوضع على حدبة الجمل مثل مقعد السيارة) 7- ماى (الماء) 8- طلمة (الظلمة، وبعض العرب ينطقونها ضلمة وربما كانت بعض الجهات تنطقها طلمة) 9- كبد بفتح الكاف وكسر الباء والجمع أكباد.. تعى البطن.. وفى بعض استعمالات العرب قديما ثقال ضرب أكباد الإبل، فلا يمكن ان تعنى كبد بمعناها التشريحى. 10 - وريد وتعنى الجزء الأمامى من الرقبـة 11- أفوك وتعنى فمك 12- عرجـا الجيم نطق المصريين أو عرقـا بالنطق السودان، وتعنى طلع (الشجرة أو الجبل) ويكون الطلوع رأسيا وليس تدريجيا. 13- سـعى وتعنى مشى بسرعـة أو جرى.
والقائمة كبيرة جدا، وربما كانت كل اللغة عربية قديمة غير مستعملة الان.. أو ان الغة العربية متفرعـة منها.. الله اعلم!!
| |
|
|
|
|
|
|
Re: فرصة لتجربة برنامج تصريف الأفعال العربية (Re: حاتم إبراهيم)
|
Quote: وأتافئ +++ ولو في Beta أرسلها لينا.. +++ أكبر همكم يكون في تبسيط التشغيل.. والقياس هو إفتراض عدم معرفة المستعمل أي شيء عن البرنامج.
|
مرحب أبو الريش، النسخة التجريبية متوفرة منذ أسبوع | أتافي (أثافي) متوفرة ومعاصرة حالياً ولو أن استخدامها انجرف لتعني شيئاً غير مستحب (ثالثة الأثافي) لسبب غير معروف. البرنامج الحالي مخصص لتصريف الأفعال (conjugation)، وسيتبعه برنامج مخصص لاشتقاق الأسماء (declension) النسخة التجريبية متوفرة منذ أسبوع واللنكات فوق وأعيدها هنا الصفحة الرئيسيةhttp://www.kalmasoft.com/KMAPS/mrlconj.htm دليل التثبيتhttp://www.kalmasoft.com/support/DOCAMRLConj.pdf Englishhttp://www.kalmasoft.com/support/DOCMRLConj.pdf
صفحة التنزيل عربيhttp://www.kalmasoft.com/KMAPS/aspmrlco.htm Englishhttp://www.kalmasoft.com/KMAPS/spmrlco.htm
بالنسبة للتبسيط، هذا همي لذا فالبرنامج يعمل بواجهة في نظري مبسطة ولكن هذا يعتمد على المستخدم بالطبع، بلغتين أعمل على أبواب الفعل والجذور المعتلة حالياً إضافة للأفعال السماعية (النسخة الحالية تصرف الجذر الثلاثي الصحيح من باب فَعَل-يَفْعِل: ضَرَب-يضْرِب) شيء غريب أن تكتشف أنك إنما تتحدث بمجموعة مستثناة من جملة مفردات اللغة (180 مليون مفردة)
|
| |
|
|
|
|
|
|
|