|
تحليل اللغة العربية بالكمبيوتر، مقدمة
|
اللغة إحدى وسائل الإشباع العاطفي في التواصل بين كائنين أو أكثر من الأحياء، وهي من المعارف المكتسبة عند البشر والرتب العليا من الحيوانات وتعتبر من الأعراض الاجتماعية لكليهما، ولمعظم اللغات نظام صوتي تصحبه تعبيرات حركية انفعالية موازية قد تؤدي نفس الغرض في إيصال المعني من الرسالة، يختلف البشر في أن بعض لغاتهم لها نظم معقدة للتدوين (scripting) مخصصة للتراسل تجعلها من اللغات المكتوبة. ملحوظة: (بعض الحيوانات تستعمل وسائل مشابهة لإيصال رسائل التحذير والإغراء مثل ترك الفضلات أو العلامات البصرية وهي تماثل نشاط التدوين عند البشر.)
ويتم وصف اللغات بالطبيعية، وهي لغات البشر المطورة اجتماعياً على مدى التاريخ البشري وكذلك يتم تمييزها بأنها لغات حية لأنها تتطور (ليس فقط لأن هناك من يتحدث بها) أو لغات ميتة (مثل الهيروغليفية والمسمارية وبعض اللغات التي تتحدث بها الأقليات).
إطلاق الاسم (طبيعية) على اللغات المعاصرة يميزها من أنواع أخرى من اللغات “الاصطناعية” وهي نوعان: 1- مخصصة للبشر: (Constructed languages) وهي لغات مدروسة أي تم وضعها بالاتفاق العلمي الأكاديمي لأهداف من بينها توحيد الدلالات والمعاني لغرض أن تكون مثلاً لغة عالمية للتواصل بين الشعوب، ولغة الإسبيرانتو (Esperanto) أبرزها إضافة إلى لغة الإنترلينغوا (Interlingua) وبعضها يستعمل في الأمم المتحدة وله جمهور متحدث به أصالة (Native speakers) لا غير. 2- مخصصة للآلات: وهذه تسمى “لغات البرمجة” ولا تختلف عن اللغات الطبيعية إلا في كونها لا تتطلب نظام صوتي وفي أنها محكومة أي أن واضعها يترك فرصة للتدخل فيها عند الضرورة بجعلها ذات أبعاد تناسب الآلات والبشر سواء.
الأصل في اللغة الطبيعية أن تكون منطوقة (Voiced) ولضعف الصوت البشري يتم تطوير نظام تدوين للغة أهم أهدافه إيصال الرسالة لمسافة أبعد من التي تتيحها قدرات البشر في الإسماع لأن النص المدون ينتقل بغير الوسائل الشفاهية الفطرية، ويكون التعليم وحفظ التراث البشري من الأغراض الثانوية للتدوين.
اللغات المكتوبة لها نظم كتابة (scripts) مختلفة وقد يجمع نظام واحد مجموعة من اللغات ولكن كل هذه النظم تتفق في أنها تأخذ في تطورها مساراً منفصلاً عن المكون الشفاهي المنطوق ولا توجد علاقة ارتباط مباشر بين الاثنين فنظام الكتابة لا يعبر مباشرة عن الصوت فالصوت المسموع والحرف المكتوب مجالان للإدراك الطبيعي منفصلان تماماً. الكتابة لا تعبر عن المعنى إلا بما يتصوره القارئ ويحقق الإشباع العاطفي عنده، هذا واضح في التمييز بين المدح والسب والانفعال بأيهما إن جاء مكتوباً، ويتم وصف نظم الكتابة إلى نوعين أساسيين نظم أبجدية يتم فيها تعيين مقاطع صوتية (phonemes) غير ذات معنى إلى رسوم بيانية نسميها بالحروف (Alphabetic monographs) وهذا النوع تستخدمه معظم اللغات المكتوبة لمرونته، ونوع آخر يوظف الرموز البدائية التي تعبر فيها الرسوم البيانية البسيطة عن أشكال تجريدية للمعنى (ideographs) تتطور عبر الزمن وقد يرتبط أي منها بصوت يكون دالاً على المعنى مباشرة، وهذا النوع هو أصل كل نظم الكتابة الذي تطورت منه لغات وبقيت عليه أخرى مثل الهيروغليفية قديماً والصينية حديثاً.
المهم هنا هو أن النص المكتوب كيف جاء يعتبر مجرد صورة موازية للكلام، هذه الصورة تقع في مجال إدراكي بصري مختلف اتفق البشر على تسميته بنشاط الكتابة والقراءة. ونخلص من التعريفات أعلاه إلى أن محاولة تحليل أي لغة طبيعية مكتوبة والإحاطة بمدلولاتها اعتماداً على النصوص المدونة لن تخلو من صعوبة تتطلب التحايل المعرفي، ولحسن الحظ فإن تطور وسائل المعالجة المختلفة بالكمبيوتر جعل منها أدوات قادرة على التعامل مع النوعين من أساليب التدوين المذكورين بل حتى أن تلك الوسائل أضحت قادرة على التعامل مع الصوت الطبيعي أو أي من صوره الإلكترونية.
اللغة العربية اللغة العربية معقدة جداً مثل غيرها من اللغات الطبيعية وما يزيدها تعقيداً جنوح الناطقين بها إلى الإكثار من استخدام المهارات البلاغية أكثر من الحاجة الفعلية إليها وفي غير مناسبة في أغلب الأحايين. وأكثر ما يميز اللغة العربية هو نظامها الخاص بتركيب المفردات والمعتمد على قائمة طويلة من المفردات البنائية تسمى (الجذور) مع هياكل بنائية مصاحبة تسمى (الميزان الصرفي) وهي ميزة حسنة - في نظر الناطقين بها - وتفيد ربما في إثراء اللغة بطريق الحيل الإملائية (Morphotactics) لكنها غير ذات بال كما يظن الكثيرون وغير مناسبة أبداً للكمبيوتر إلا على المستوى الصرفي.
على المستوى الصرفي (Morphology) توصف اللغة العربية بأنها مفرطة الاشتقاق (Highly inflectional) وهذه تعني أن لها المقدرة على توليد أكثر من مفردة تنبني على ذات الأصل الصرفي، والإفراط هنا لأنها بالفعل يمكن لنظامها الإملائي توليد عشرات الآلاف من المفردات من أصل (جذر) واحد، وتعتمد اللغة العربية الأسلوب الأبجدي للتدوين باستعمال طقمين من الحروف أحدها أساسي والثاني يستعمل عند الضرورة للإبانة والتوضيح يسمى (التشكيل)، نظام الكتابة العربية ذاته تطور من سلالة طويلة من نظم الكتابة السابقة من بينها السومرية والنبطية تفرعت في مراحل مختلفة حتى بلغت شكلها المعاصر وقد كانت في مرحلة سابقة تكتب حروفها مرسلة بدون تمييز بالتنقيط أو الترقيم، والمعروف أن اللغة العربية لم ينشط الاهتمام بتحسين تدوينها إلا لحاجات ضرورية مثل رصد النصوص الدينية فمجتمع الجزيرة العربية كان مجتمعاً شفاهياً لا يعتمد التدوين في أغلب أنشطته الاجتماعية التقليدية.
على المستوى النحوي (Syntax) توصف اللغة العربية بأنها سلسة نحوياً (Non-rigid Grammar) هذا يعني أن أجزاء الكلام المنصوص يمكن أن تأخذ ترتيباً مختلفاً داخل الجملة مع تفضيل غالب لتقديم الفعل فالفاعل ثم المفعول (VSO)، لكن هذا التفضيل يعتمد على الطبقة اللغوية المستعملة (Dialect level)، والمعروف أن اللغة العربية اكتسبت طبقات متعددة أقلها اثنتان على مدى القرون الفائتة. وعلى نفس المستوى النحوي يمكن أن نصف اللغة العربية بأنها مفرطة نحوياً (Syntax verbose) وهذا يعني أن لها تركيبات (وأدوات) غير ضرورية لبناء الجملة، ونقصد هنا تركيب الجملة وليس المعاني البلاغية مثل الاستعارات، والمقصود أن ليس لهذه الأدوات وظائف محددة غير أنها تدخل حشواً ضمن التركيب العام للجملة،
لنتأمل النماذج التالية: 1- إن السيارة معطلة (السيارة معطلة) 2- نحن نحتاج إلى الماء (نحتاج الماء) 3- وقد أكد الرئيس أنه سيتم ملاحقة المعتدين (وأكد الرئيس ملاحقة المعتدين) 4- الحياة من دون ابتلاء لا تستحق العيش (الحياة دون ابتلاء لا تستحق العيش)
النماذج أعلاه حقيقية ولم نتعمد حشوها لإيضاح وجهة نظرنا فهي مختصرة ونلحظ بسهولة أن حذف الأجزاء باللون الأحمر لا يغير من المعنى ولا يخل بالبناء شيئاً.
على المستوى الدلالي (Semantic) توصف اللغة العربية بأنها (Verbose) أي تميل إلى الحشو للتعبير عن المعاني البسيطة، المثالين التاليين يعبران عن هذه النقطة:
1- غاية الأدب أن يستحي المرء من نفسه (الحياء من الأدب) 2- لا نقاتل لنغلـب ، لكننا نقاتل لنحـرر ، ونحن لا نقاتل للتوسـع ،ولكننا نقاتل لنحيا (لا نقاتل لنغلب ونتوسع بل لنحرر ونحيا)
وتوصف اللغة العربية أيضاً بأنها مبهمة أو غامضة دلالياً (Ambigious) بمعنى أن المعاني لا تظهر مباشرة من النصوص إلا بمقدار الإيضاح المضمن فيها سواء من السياق أو من طبيعة المفردات ذاتها، كل اللغات غامضة جداً إذا كان مقياس الغموض هذا هو عدم تعبير النص عن المعنى، فهذا أمر يعتمد على ثقافة المؤلف والقاريء بالدرجة الأولى وعلى حسن تنظيم البناء النحوي للغة، وهذا مستحيل في حالة اللغات الطبيعية فهي مجرد وسائل فطرية للتواصل تم تدبيرها (doctored) بدون اتفاق مسبق. وبالطبع لا نريد الولوج في فلسفة اللغة وعلم الأصول (Etymology) لأن الموضوع عن التطبيقات، فحتى المفردات ذاتها يمكن أن نتعمق فيها ونبين أن لا معنى لها في الواقع إلا ما تواضع الناس على وصلها به اجتهاداً أو ممارسة.
مقتبس من موضوع أكاديمي، المصدر (academia.edu/6125403/A_New_Approach_to_Arabic_Part_of_Speech_Tagging)
|
|
|
|
|
|
|
العنوان |
الكاتب |
Date |
تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-24-14, 08:02 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | محمد مختار جعفر | 08-24-14, 09:34 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-24-14, 11:32 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | Nasr | 08-25-14, 06:52 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | Abureesh | 08-25-14, 07:16 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-25-14, 07:01 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | جعفر محي الدين | 08-25-14, 08:17 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | احمد عمر محمد | 08-25-14, 09:51 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-25-14, 09:47 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-25-14, 10:31 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | Bushra Elfadil | 08-25-14, 01:13 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-26-14, 09:30 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-27-14, 07:33 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-29-14, 06:21 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | بريمة محمد | 08-29-14, 12:13 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-29-14, 04:27 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 08-30-14, 09:57 AM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 09-06-14, 03:18 PM |
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة | حاتم إبراهيم | 10-13-14, 08:47 PM |
|
|
|