تحليل اللغة العربية بالكمبيوتر، مقدمة

مرحبا Guest
اخر زيارك لك: 04-27-2024, 01:34 PM الصفحة الرئيسية

منتديات سودانيزاونلاين    مكتبة الفساد    ابحث    اخبار و بيانات    مواضيع توثيقية    منبر الشعبية    اراء حرة و مقالات    مدخل أرشيف اراء حرة و مقالات   
News and Press Releases    اتصل بنا    Articles and Views    English Forum    ناس الزقازيق   
مدخل أرشيف الربع الثانى للعام 2014م
نسخة قابلة للطباعة من الموضوع   ارسل الموضوع لصديق   اقرا المشاركات فى شكل سلسلة « | »
اقرا احدث مداخلة فى هذا الموضوع »
08-24-2014, 08:02 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
تحليل اللغة العربية بالكمبيوتر، مقدمة

    اللغة إحدى وسائل الإشباع العاطفي في التواصل بين كائنين أو أكثر من الأحياء،
    وهي من المعارف المكتسبة عند البشر والرتب العليا من الحيوانات وتعتبر من الأعراض الاجتماعية لكليهما،
    ولمعظم اللغات نظام صوتي تصحبه تعبيرات حركية انفعالية موازية قد تؤدي نفس الغرض في إيصال المعني من الرسالة،
    يختلف البشر في أن بعض لغاتهم لها نظم معقدة للتدوين (scripting) مخصصة للتراسل تجعلها من اللغات المكتوبة.
    ملحوظة: (بعض الحيوانات تستعمل وسائل مشابهة لإيصال رسائل التحذير والإغراء مثل ترك الفضلات أو العلامات البصرية وهي تماثل نشاط التدوين عند البشر.)

    ويتم وصف اللغات بالطبيعية، وهي لغات البشر المطورة اجتماعياً على مدى التاريخ البشري وكذلك يتم تمييزها
    بأنها لغات حية لأنها تتطور (ليس فقط لأن هناك من يتحدث بها) أو لغات ميتة (مثل الهيروغليفية والمسمارية وبعض اللغات التي تتحدث بها الأقليات).

    إطلاق الاسم (طبيعية) على اللغات المعاصرة يميزها من أنواع أخرى من اللغات “الاصطناعية” وهي نوعان:
    1- مخصصة للبشر: (Constructed languages) وهي لغات مدروسة أي تم وضعها بالاتفاق العلمي الأكاديمي لأهداف من بينها
    توحيد الدلالات والمعاني لغرض أن تكون مثلاً لغة عالمية للتواصل بين الشعوب، ولغة الإسبيرانتو (Esperanto) أبرزها إضافة إلى
    لغة الإنترلينغوا (Interlingua) وبعضها يستعمل في الأمم المتحدة وله جمهور متحدث به أصالة (Native speakers) لا غير.
    2- مخصصة للآلات: وهذه تسمى “لغات البرمجة” ولا تختلف عن اللغات الطبيعية إلا في كونها لا تتطلب نظام صوتي وفي أنها محكومة
    أي أن واضعها يترك فرصة للتدخل فيها عند الضرورة بجعلها ذات أبعاد تناسب الآلات والبشر سواء.

    الأصل في اللغة الطبيعية أن تكون منطوقة (Voiced) ولضعف الصوت البشري يتم تطوير نظام تدوين للغة أهم أهدافه
    إيصال الرسالة لمسافة أبعد من التي تتيحها قدرات البشر في الإسماع لأن النص المدون ينتقل بغير الوسائل الشفاهية الفطرية،
    ويكون التعليم وحفظ التراث البشري من الأغراض الثانوية للتدوين.

    اللغات المكتوبة لها نظم كتابة (scripts) مختلفة وقد يجمع نظام واحد مجموعة من اللغات ولكن كل هذه النظم تتفق في أنها
    تأخذ في تطورها مساراً منفصلاً عن المكون الشفاهي المنطوق ولا توجد علاقة ارتباط مباشر بين الاثنين
    فنظام الكتابة لا يعبر مباشرة عن الصوت فالصوت المسموع والحرف المكتوب مجالان للإدراك الطبيعي منفصلان تماماً.
    الكتابة لا تعبر عن المعنى إلا بما يتصوره القارئ ويحقق الإشباع العاطفي عنده، هذا واضح في التمييز بين المدح والسب والانفعال بأيهما إن جاء مكتوباً،
    ويتم وصف نظم الكتابة إلى نوعين أساسيين نظم أبجدية يتم فيها تعيين مقاطع صوتية (phonemes) غير ذات معنى إلى رسوم بيانية نسميها بالحروف (Alphabetic monographs) وهذا النوع تستخدمه معظم اللغات المكتوبة لمرونته،
    ونوع آخر يوظف الرموز البدائية التي تعبر فيها الرسوم البيانية البسيطة عن أشكال تجريدية للمعنى (ideographs)
    تتطور عبر الزمن وقد يرتبط أي منها بصوت يكون دالاً على المعنى مباشرة،
    وهذا النوع هو أصل كل نظم الكتابة الذي تطورت منه لغات وبقيت عليه أخرى مثل الهيروغليفية قديماً والصينية حديثاً.

    المهم هنا هو أن النص المكتوب كيف جاء يعتبر مجرد صورة موازية للكلام، هذه الصورة تقع في مجال إدراكي بصري مختلف اتفق البشر على تسميته بنشاط الكتابة والقراءة. ونخلص من التعريفات أعلاه إلى أن محاولة تحليل أي لغة طبيعية مكتوبة والإحاطة بمدلولاتها اعتماداً على النصوص المدونة لن تخلو من صعوبة تتطلب التحايل المعرفي،
    ولحسن الحظ فإن تطور وسائل المعالجة المختلفة بالكمبيوتر جعل منها أدوات قادرة على التعامل مع النوعين من أساليب التدوين المذكورين
    بل حتى أن تلك الوسائل أضحت قادرة على التعامل مع الصوت الطبيعي أو أي من صوره الإلكترونية.

    اللغة العربية
    اللغة العربية معقدة جداً مثل غيرها من اللغات الطبيعية وما يزيدها تعقيداً جنوح الناطقين بها إلى الإكثار
    من استخدام المهارات البلاغية أكثر من الحاجة الفعلية إليها وفي غير مناسبة في أغلب الأحايين.
    وأكثر ما يميز اللغة العربية هو نظامها الخاص بتركيب المفردات والمعتمد على قائمة طويلة من المفردات البنائية
    تسمى (الجذور) مع هياكل بنائية مصاحبة تسمى (الميزان الصرفي) وهي ميزة حسنة - في نظر الناطقين بها - وتفيد ربما في إثراء اللغة بطريق الحيل الإملائية
    (Morphotactics) لكنها غير ذات بال كما يظن الكثيرون وغير مناسبة أبداً للكمبيوتر إلا على المستوى الصرفي.

    على المستوى الصرفي (Morphology) توصف اللغة العربية بأنها مفرطة الاشتقاق (Highly inflectional) وهذه تعني أن لها المقدرة
    على توليد أكثر من مفردة تنبني على ذات الأصل الصرفي، والإفراط هنا لأنها بالفعل يمكن لنظامها الإملائي توليد عشرات الآلاف من المفردات من أصل (جذر) واحد،
    وتعتمد اللغة العربية الأسلوب الأبجدي للتدوين باستعمال طقمين من الحروف أحدها أساسي والثاني يستعمل عند الضرورة للإبانة والتوضيح يسمى (التشكيل)،
    نظام الكتابة العربية ذاته تطور من سلالة طويلة من نظم الكتابة السابقة من بينها السومرية والنبطية تفرعت في مراحل مختلفة حتى بلغت شكلها المعاصر وقد كانت في مرحلة سابقة تكتب حروفها مرسلة بدون تمييز بالتنقيط أو الترقيم،
    والمعروف أن اللغة العربية لم ينشط الاهتمام بتحسين تدوينها إلا لحاجات ضرورية مثل رصد النصوص الدينية فمجتمع الجزيرة العربية كان مجتمعاً شفاهياً لا يعتمد التدوين في أغلب أنشطته الاجتماعية التقليدية.

    على المستوى النحوي (Syntax) توصف اللغة العربية بأنها سلسة نحوياً (Non-rigid Grammar) هذا يعني أن أجزاء الكلام المنصوص
    يمكن أن تأخذ ترتيباً مختلفاً داخل الجملة مع تفضيل غالب لتقديم الفعل فالفاعل ثم المفعول (VSO)،
    لكن هذا التفضيل يعتمد على الطبقة اللغوية المستعملة (Dialect level)،
    والمعروف أن اللغة العربية اكتسبت طبقات متعددة أقلها اثنتان على مدى القرون الفائتة.
    وعلى نفس المستوى النحوي يمكن أن نصف اللغة العربية بأنها مفرطة نحوياً (Syntax verbose) وهذا يعني أن لها تركيبات (وأدوات) غير ضرورية لبناء الجملة،
    ونقصد هنا تركيب الجملة وليس المعاني البلاغية مثل الاستعارات،
    والمقصود أن ليس لهذه الأدوات وظائف محددة غير أنها تدخل حشواً ضمن التركيب العام للجملة،

    لنتأمل النماذج التالية:
    1- إن السيارة معطلة (السيارة معطلة)
    2- نحن نحتاج إلى الماء (نحتاج الماء)
    3- وقد أكد الرئيس أنه سيتم ملاحقة المعتدين (وأكد الرئيس ملاحقة المعتدين)
    4- الحياة من دون ابتلاء لا تستحق العيش (الحياة دون ابتلاء لا تستحق العيش)

    النماذج أعلاه حقيقية ولم نتعمد حشوها لإيضاح وجهة نظرنا فهي مختصرة ونلحظ بسهولة أن حذف الأجزاء باللون الأحمر لا يغير من المعنى ولا يخل بالبناء شيئاً.

    على المستوى الدلالي (Semantic) توصف اللغة العربية بأنها (Verbose) أي تميل إلى الحشو للتعبير عن المعاني البسيطة،
    المثالين التاليين يعبران عن هذه النقطة:

    1- غاية الأدب أن يستحي المرء من نفسه (الحياء من الأدب)
    2- لا نقاتل لنغلـب ، لكننا نقاتل لنحـرر ، ونحن لا نقاتل للتوسـع ،ولكننا نقاتل لنحيا (لا نقاتل لنغلب ونتوسع بل لنحرر ونحيا)

    وتوصف اللغة العربية أيضاً بأنها مبهمة أو غامضة دلالياً (Ambigious) بمعنى أن المعاني لا تظهر مباشرة من النصوص
    إلا بمقدار الإيضاح المضمن فيها سواء من السياق أو من طبيعة المفردات ذاتها،
    كل اللغات غامضة جداً إذا كان مقياس الغموض هذا هو عدم تعبير النص عن المعنى،
    فهذا أمر يعتمد على ثقافة المؤلف والقاريء بالدرجة الأولى وعلى حسن تنظيم البناء النحوي للغة،
    وهذا مستحيل في حالة اللغات الطبيعية فهي مجرد وسائل فطرية للتواصل تم تدبيرها (doctored) بدون اتفاق مسبق.
    وبالطبع لا نريد الولوج في فلسفة اللغة وعلم الأصول (Etymology) لأن الموضوع عن التطبيقات،
    فحتى المفردات ذاتها يمكن أن نتعمق فيها ونبين أن لا معنى لها في الواقع إلا ما تواضع الناس على وصلها به اجتهاداً أو ممارسة.

    مقتبس من موضوع أكاديمي، المصدر (academia.edu/6125403/A_New_Approach_to_Arabic_Part_of_Speech_Tagging)
                  

08-24-2014, 09:34 PM

محمد مختار جعفر
<aمحمد مختار جعفر
تاريخ التسجيل: 11-15-2005
مجموع المشاركات: 4927

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    الأخ / حاتم إبراهيم ..
    شكراً ..
    وإضافة طيبة ، في بحر اللغة العربية
                  

08-24-2014, 11:32 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    مشكور الأخ الأستاذ محمد مختار

    أنا مهتم بمجال (Computational Linguistics) أعتقد يترجمونها اللغويات الحاسوبية.
    في أبسط تعريف لها (مجال يهتم بوضع نماذج للغة الطبيعية بحيث يمكن معالجتها بالكمبيوتر)
    كلمة نماذج هنا متنوعة وتعتمد على التخصص الفرعي.

    مرحباً بك
                  

08-25-2014, 06:52 AM

Nasr
<aNasr
تاريخ التسجيل: 08-18-2003
مجموع المشاركات: 10821

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    من أمتع ما قرأت عن اللغة
    واللغة العربية
    واصل يا رعاك الله
                  

08-25-2014, 07:16 AM

Abureesh
<aAbureesh
تاريخ التسجيل: 09-22-2003
مجموع المشاركات: 30182

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: Nasr)

    سلام يا حاتم،
    موضوع مهم لا شك.. ولكن واضح ان الكاتب قد أخذ لغـة معينة، قد تكون الإنجليزية كنظام إسناد ليقيم وفق
    منهجها اللغـة العربيـة.. وبذلك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..
    ارجو ان اجد الوقت للتفصيل...
                  

08-25-2014, 07:01 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    مشكور أستاذ نصر

    الموضوع منشور في موقع أكاديميا 21 صفحة بالرسومات والجداول
    متخصص شوية عشان كدة نشرت الجزء المناسب منه هنا للفائدة
    ويمكن تنزل نسخة بي دي إف
    احتمال يطلب الدخول بالفيسبوك قبل التنزيل، إذا صعبت خليني أعرف

    مشكور مرة أخرى
                  

08-25-2014, 08:17 AM

جعفر محي الدين
<aجعفر محي الدين
تاريخ التسجيل: 11-12-2008
مجموع المشاركات: 3649

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    شكرا حاتم إبراهيم
    على هذه المادة القيمة والشيقة في آن
    هذا التحليل يمثل البداية الحقيقية لمعالجة اللغة العربية بالحاسب الآلي
    نشكر لك تنويرنا وكنت اعتب كثيرا على أهل العربية عن تأخرهم في إنتاج برامج كمبيوتر تعالج اللغة العربية
    إدخالا وترجمة ولكني بعد قراءة ما جلبت هنا وجدت لهم بعض العذر
    أرجو أن تخرج لنا بالجديد المفيد في هذا المجال فالعربية تأخرت كثيرا في أن تحتل المكان اللائق بها
    في عصر التقدم التقني والحاسوبي هذا
                  

08-25-2014, 09:51 AM

احمد عمر محمد
<aاحمد عمر محمد
تاريخ التسجيل: 01-10-2013
مجموع المشاركات: 1273

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: جعفر محي الدين)

    تحية طيبة صاحب الخيط و الاخوة المتحاورين
    السلام عليكم ورحمة الله وبركاته
    الموضوع شيق صراحة وانا اذهب الى ما ذهب اليه الاخ ابوالريش لانه دائماً تتم تناول المشاكل المتعلقة باللغة
    من وجهة نظر الباحث (للغة معينة) ويناقش بصورة متوازية معها لغة اخرى لذا تبدو لنا صور تغليب احداهن
    على الاخرى وذلك بحكم الاسقاطات المتوافرة من الباحث للغته الام و المقارنة مع اللغة الاخرى.
    و بالطبع كل باحث اصيل في لغته سيجد العنت في تناول لغتين ومناقشة ماهيتهم وتحليلهم بقدر كافي في حال كان
    يعتمد على لغته و يفارنها باخرى وبرغم ذلك فاني ارى ان امكانية تحليل اللغة الانجليزية بلسان عربي قد تكون
    من اكثر الالتقاءت في اللغات البشرية ويمكن ان نخلق منها امتاعاً وابحاراً عجيب والغوص فيهما.
    بالفعل ما اوردته يا اخ حاتم فيه بعض التعليقات خاصة فيما يتعلق في العربية ومشاكلها التي لاتنهي بدءً من
    التاصيل لEtymology وانطلاقاً نحو الوحدات العليا في تدرج اللغة العربية وطرائق كتابتها وتحليلها.
    ارجوا ان يظل الخيط عالياً و لي عودة ان شاء الله
    دم بخير اخي حاتم
                  

08-25-2014, 09:47 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    مرحبا استاذ جعفر

    الموضوع متوفر باللغة الإنجليزية إذا رغبت في الاستزادة، شكراً لك.


    الأخ أبو الريش
    مشكور على الإطلاع، لكن أرجو أن تطلع على الورقة كاملة، المنشور هنا مجرد صفحتين من 21 صفحة للجزء الأول من ثلاثة أجزاء أعمل عليها.
    لم استند على اللغة الإنجليزية، ولدي ما أزن به اللغة العربية.
    لكن لا أمانع أن أتزود بموازين إضافية منك
    فهل تتكرم بها؟
                  

08-25-2014, 10:31 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    السلام على الجميع

    أنا سعيد جداً أن يتفاعل الناس مع الموضوع مع طبيعته التخصصية
    وفي الحقيقة لم أتوقع ذلك أبداً نظراً لطبيعة المنبر.

    وآمل أن يطلع الناس على الموضوع بالكامل أولاً
    وكلي آذان صاغية للنقاش.

    الموضوع باللغة العربية: kalmasoft.com/papers/PA-13-ST01.pdf

    الموضوع بالانجليزية: kalmasoft.com/papers/PE-13-ST01.pdf


    آمل أن يستفيد الجميع
                  

08-25-2014, 01:13 PM

Bushra Elfadil
<aBushra Elfadil
تاريخ التسجيل: 06-05-2002
مجموع المشاركات: 5252

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    بوست رفيع ولذا يجب ان يرفع دائماًونأمل أن نتواصل معه.
                  

08-26-2014, 09:30 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    أسباب صعوبة المعالجة الآلية للغة العربية

    تتعدد التطبيقات ولكن النتائج المتقاربة للمصنفات تدل على شيء واحد، تشابه الأساليب، وهذا سببه بعض من الصعوبة في فهم الأساسيات المتعلقة منها باللغة أو طريقة عمل الكمبيوتر،
    ومعظم هذه الصعوبات منسوب إلى طبيعة اللغة العربية إضافة إلى أسباب أخرى تعود إلى مستهلكيها، نسرد هنا الأسباب كلها والتي توصلنا إليها من خلال المتابعة الدائمة والمراقبة
    لكل ما يستجد في هذا المضمار:

    1. تعدد الطبقات
    بعض اللغات ثنائية الطبقات (Diglossiac) هذا يعني أن الناطقين باللغة يعتمدون نوعين منها واحدة للصفوة وأخرى للعوام هذا ليس تقسيماً اجتماعياً بل ثقافي
    فأي من الفئتين يمكنه استعمال الطبقة التي تعجبه في أي موقف، اللغة العربية ثلاثية الطبقات (Triglossiac)، فمنها لغة كلاسيكية منضبطة المكتوب بها القرآن والأعمال الأدبية
    مثل الشعر الجاهلي ثم لغة أبسط “فصحى” وهي لغة الصحافة والإعلام، إضافة إلى لغة عامية تتباين بحسب عوامل جغرافية واجتماعية عدة
    (أسمينا كل طبقة “لغة” لأن أي منها له هياكله البنائية والنحوية والدلالية مثل أي لغة حقيقية). الصعوبة في هذا الأمر أن التداخل بين الطبقات الثلاث يحدث دائماً
    سيما لا توجد دولة عربية يتحدث سكانها الفصحى في أمور الشأن العام وكذلك لا تخلو مداولات الشأن الخاص من التعرض لبعض مكونات الفصحى
    كالاقتباس من المصادر الثقافية التاريخية، وقد تأتي العامية في مقام الفصحى، فالعامية المصرية مثلاً تستخدم رسمياً في الإعلام،
    ويحدث تأثير وتداخل بين الطبقات الثلاث على المستوى الصرفي، في النصوص المغاربية مثلاً يأتي ذكر (بحبوش، كنبغيك، لحْسَن) أحياناً في كتابات رسمية.


    2. تأثير اللغات الأخرى
    هذه ليست مشكلة تخص اللغة العربية منفردة فكل اللغات تتداخل طبيعياً، التداخل المعجمي باستعارة الألفاظ والمصطلحات والتداخل النحوي بتبني القواعد النحوية
    (كما في العامية السورية واللبنانية باستعارة قواعد الآرامية، وباستعارة قواعد الأمازيغية في اللغات العامية في المغرب العربي وباستعارة قواعد القبطية في العامية المصرية
    أو حتى في اللغات الأوروبية المعاصرة فالفرنسية مثلاً استعارت من قواعد اللاتينية بينما أكثرت اللغة الإيطالية من الاستعارة من مفرداتها، والأهم من ذلك الترجمة الحرفية
    التي تحدث بسبب عدم مواكبة اللغة لمستحدثات العلوم المختلفة، مصطلح (محرك بحث) مثلاً ترجمة حرفية لمصطلح (Search Engine) وإعادة توطين مفردات تم تغريبها
    مثل (خوارزمية وألغوريثم)، وقد يحدث التداخل بين منطقتين متباعدتين جغرافياً بسبب الهجرات القديمة أو الحديثة المنظمة فسواحل الخليج (الإمارات وعمان والبحرين وقطر)
    تشهد التداخل بين اللغة العربية والأردو والهندية والفارسية وهذا ينتج عنه لغة هجينة (Creole) تفرضها ظروف التفاعل الاقتصادي.


    3. تعدد الاختلافات الإقليمية
    ربما تكون هذه أكبر مشكلة مخفية حتى الآن، فالنص العربي ينتشر في بقعة واسعة ويتم التعامل معه كل باختلاف ثقافته وتفضيلاته المحلية، وبالمقارنة فاللغة الصينية تتوزع باختلافات
    يسيرة في تايوان وهونغ كونغ والصين والإنجليزية ينحصر اختلافها الكبير بين بريطانيا وأمريكا وعلى نحو أقل في استراليا وكندا والهند وجنوب أفريقيا، بينما العربية تتعدد اختلافاتها
    بقدر عدد الدول الناطقة بها، المؤسف أن هذه الاختلافات الإقليمية توجد في أهم طبقة وهي العربية الفصحى المستعملة في الوسائل الإعلامية وهي تمثل نسبة كبيرة من النصوص
    العربية المتوفرة اليوم على هيئة مكانز (مدونات) وهي المستهدفة بالمعالجة.

    من الواضح أن الاختلافات هنا أسبابها ثقافية تتعلق بالمنطقة الحضرية وتأثرها بالبيئة حولها وتظهر جلية في المفردات الحديثة الوافدة مثل (موبايل) وهذا يوجد أيضاً على مستويات
    أخرى إملائية مثلاً غوغول تكتب (قوقل، غوغل، جوجل، گوگل، and#1891;وand#1891;ل) في السعودية ومصر والعراق والمغرب، ومن أسبابها الأخرى الميل الصرفي (Lexical Bias) (1) وهو
    تفضيل صيغ صرفية محددة على غيرها، فمثلاً الشائع في اللغة استخدام مفردة "محطَّم" وليس "محطوم" رغماً عن صحتها لغوياً ومناسبتها للوصف فهي اسم مفعول مثل (مهزوم)،
    ويستخدم البعض اللفظ "مربوح" وهو نادر إلا في المغرب العربي، ولهذا ذكرنا قبلاً أن فرط توليد المفردات قد لا يكون ميزة إيجابية إذا لم يتفق الناس على كيفية الاستفادة منه،
    فلا يمكن تعميم القالب الصرفي على أي مفردة، إذن لحصلنا على كلمات تبدو (غريبة) للبعض مثل “مرغوم، كاسور، جابن، مخواف، كواذب، زبناء، رابوط، ضوارب، شبيع”.

    الأمر الجيد أن في اللغة العربية متسع من هذه الحيل، والأمر ليس كله سوء، فلو تتبعنا النواتج غير المستخدمة من فضْلات تطبيق النظام الصرفي لأمكن حل مشاكل عديدة
    أولها إيجاد مقابلات للمفردات الحديثة الوافدة من اللغات الأخرى والتي أوفرها ما يستخدم في الحاجات الأساسية للبشر حيث تختلف الأسماء بسبب أن مسمياتها غالباً ما تنتشر جغرافياً
    في ذات الوقت، الميل الصرفي لا علاقة له بالترادف، الإنجليز مثلاً يستخدمون المصطلحات (Lift, Petrol, Tube) لتسمية المصعد والوقود وقطار الأنفاق
    بينما الأمريكان يقولون (Elevator, Gas, Subway) لذات المسميات، الحل باستخدام حلول معجمية فالأسماء مجالها واسع ولا يوجد غير الحل المعجمي.


    4. عدم وجود فوارق شكلية واضحة بين مكونات النص
    بعض اللغات تميز أجزاء الكلام بأنواع مختلفة من الحروف واللواصق (Affixes)، فالإنجليزية مثلاً تستخدم الأحرف الكبيرة لتمييز طائفة الأسماء والأعلام (Proper nouns)
    ثم مقاطع غيرها تحدد بشكل واضح نوع المفردة بنحو أدق مصدراً كانت أو صفة أو نسبة مثل (tion, ty, ed, ese, ing)، بل أضافت مقاطع من اللاتينية ذات معنى
    مثل (pro, ex, mal, para, con) لذا فإن طائفة المشذبات (Stemmers) تعمل معها بنجاح تام، واليابانية تستخدم ثلاث أطقم من الحروف أحدها (يسمى كاتاكانا)
    مخصص بالكامل للمفردات الدخيلة عليها فإذا أرادوا ذكر الرئيس الأمريكي باراك أوباما كتبوا (and#12496;and#12521;and#12463;·and#12458;and#12496;and#12510;) كذلك لها بنية ثابتة للجملة تميز أجزاء الكلام على المستوى النحوي.

    العربية تستخدم ذات المفردات لشتى الأغراض فهي أحياناً أسماء (صفات، أعلام) وحين آخر أفعال وتعتمد فقط على الأوزان (Morphological Templates) التي تستخدمها عدة
    لغات مثل العبرية واليابانية، وبعض الأفعال المساعدة والنواسخ والجوامد والظروف وتستخدم بعض الأسماء للاعلام (أبو، ابن إضافة للنسبة والنسب) ومثالنا (شرب أحمد الحليب)
    كان معبراً تماماً عن هذه المشكلة التي ينتج عنها خلل على المستويين النحوي والدلالي.(2)
    فبالنسبة للكمبيوتر فإن أي من المفردات (شرب، أحمد) يمكن أن تكون فعل أو صفة بينما (الحليب) يمكن أن تكون اسم علم، وكل الجملة (شرب أحمد الحليب) يمكن في أقصى
    الحالات أن تكون اسماً كاملاً يماثل (فهد أحمد الخطيب) إملائياً.



    5. إفتقار اللغة العربية لمبدأ الوحدة الدلالية
    تقوم اللغة العربية صرفاً وإملاء على مبدأ الاشتقاق (Inflection) بالبناء على الجذر، وهي تشترك في هذه الميزة مع بقية لغات العائلة السامية (الآرامية والعبرية)
    والأفريقية السامية (التغرينيا والأمهرية)، كل جذر ثلاثي صحيح يمكن أن يشتق منه حوالي 30 ألف مفردة نظرياً (مع كل الزوائد الاشتقاقية والصرفية الممكنة)،
    كان يمكن أن يقدم الجذر خدمة عظيمة للغة لو كانت مشتقاته تتفق كلها دلالياً لكن للأسف هذا لا ينطبق إلا على فئة محدودة من الجذور،
    مبدأ الوحدة الدلالية (ٍSemantic Consistency) معيار جديد من اقتراح الباحث وهو يوظف الدلالة التكوينية (Ontology) وله قياسات حسابية كمية
    يستعملها المصنف الموسع (Deep Tagger) ويختلف عن الترادف (Synonymy) الذي يبحث في مطابقة المعنى أو التناظر الذي يبحث في تباين المعنى مثل
    (درس التمليذ الواجب) و (درس الحمار الشعير)، أنظر أدناه لنموذجين للجذرين (ضرع) و(بلغ)،

    اللغة العربية تتصف بالتشظي الدلالي (Semantic Dispersion) أو التشتت الدلالي(3) الذي يحسب ثراءاً بلاغياً في اللغة لكنه ليس في مصلحة أي تطبيق لمعالجة النصوص
    بأسلوب منطقي يستقي مقدماته من اتساق معاني المفردات المشتقة من أصل وحيد، فإن كانت ذات معامل تشتت كبير فهي إذن مختلفة الدلالات ولن يصلح الأمر إلا بتوليد كل المفردات
    المحتملة للجذر ومضاهاتها بمقابلاتها في اللغة المستهدفة. عملية توليد كل الاشتقاقات تنتج ما يعرف بالقاموس التام (Full Form Dictionary) وهي المشكلة التي أشرنا إليها سابقاً
    إذ أن توليد 30 ألف مفردة لا يتطلب شيئاً يذكر في الكمبيوترات الحديثة من ناحية الحفظ في الذاكرة ولكنها تسبب تأخيراً بائناً إذا وجب توليدها ضمن برنامج تنسيق نصوص لدعم ميزة
    التصحيح الإملائي مثلاً، كذلك وجود هذا الكم الكبير من المفردات بلا رابط يجمعها دلالياً لا فائدة منطقية ترجى منه.(4)

    التشتت الدلالي مشكلة باقية (Persistent) من أصل اللغة أي أنها غير ذات ارتباط بالعصور المختلفة لتطور اللغة ومدى تداخلها المعاصر مع التطور الحياتي البشري الذي يسبب
    انزياح المعنى، فمصطلحات معاصرة مثل (عربة، حافلة، سيارة) لا يجوز التسرع في الحكم بمدلولاتها بمعزل عن السياق الزمني للنصوص التي وردت فيها فهي “معروفة” اليوم
    ولكن لها دلالاتها المختلفة إذا جاءت ضمن نصوص أدبية قديمة كما في الشعر الجاهلي فكلمة (حافلة) آنذاك لم تكن أبداً مركبة تسير على أربع أو ست عجلات،
    هذا يسمى انزياح المعنى (Semantic Shift)، ولكن اللغة العربية أصلاً تفتقر للوحدة الدلالية فحتى مفردات شائعة مثل “ضرب” والتي تنتمي لذات الجذر مع أخريات
    (ضَرْب، ضريب، مضارب، ضِراب، ضُروب، إضراب، ضريبة) لا تسلم من هذه المشكلة بدون أن نتطرق حتى لدلالاتها المعاصرة.
    لن تكون اللغة الطبيعية معيارية أبداً وإن كتبت بها النصوص الدينية لسبب بسيط وهي أنها تعبر عن محمولات ثقافية شفاهية معاصرة لزمان معين، وواحدة من المشاكل
    أن النص المكتوب في اللغات الأبجدية يفترض فيه أنه يكون تمثيلاً للصوت ولكن الصوت ذاته ليس معياراً فالكلمة الواحدة يمكن أن تنطق بأكثر طريقة
    حتى بين أفراد العائلة الواحدة في نطاق جغرافي واحد.


    6. الاستخدام المفرط للاستعارات
    هذه واحدة من المشاكل في كل اللغات لكنها في اللغة العربية من أكبرها وتظهر جلية وبائنة لأي دارس مبتدئ، ولا تكاد تخلو أي فقرة مكتوبة منها،
    ومشكلة الاستعارات (m e t a ph o r s) أنها لا تضيف معلومة بقدر ما تعمل على تحسين الخصائص البلاغية للنص أو التأثير العاطفي على المتلقي بإضافة المؤثرات النفسية
    مثال الجملتين (رزق فلان بفارس) و (أزاحت الشركة الستار) فأيهما لا تشير دلالياً أو نحوياً من قريب أو بعيد إلى حدوث الولادة أو إعلان بدء التسويق لمنتج تجاري،
    بل تعتمدان على المقاربة البلاغية باستخدام الاستعارات المركبة التي تعتمد بالكامل على الخبرات اللغوية للمتلقي وحسن تفسيره للمعنى بناء على ثقافته
    وهو أمر يخرج عن سيطرة الكمبيوتر أو أي تطبيق برمجي يعمل على أساس التحليل المنطقي المباشر المعتمد على النص المرسوم.
    بل حتى على مستوى الوصف المباشر توجد مفردات نحسبها واضحة وهي غير ذلك، مثلاً الصفتان “أبيض” و”بيضاء” ليستا وصفاً للون فحسب بل الشكل والحجم أيضاً
    (إذا عممنا) القاعدة، فالصفتين أصلهما من الاسم “بيض”.


    7. عدم وجود علامات التشكيل
    علامات التشكيل هي الطقم الثاني من رموز تدوين اللغة العربية ويجب أن تعتبر حروف من وجهة نظر أي تطبيق لمعالجة النصوص العربية،
    فهي لها شكل (Grapheme) وقواعد إملائية ولا تختلف فعلياً عن الحروف الأخرى إلا في قلة استخدامها، وعند مقارنتها بالحروف الأساسية للغة العربية فهي صوائت قصيرة
    (Short Vowels) وتستوي اللغة العربية في هذه الميزة مع اللغة العبرية الحديثة (تسمى بالإسرائيلية)، فاليهود يهملون التشكيل بالتنقيط ويسمون علامات التشكيل عندهم
    نِيقوط (and#1504;and#1456;and#1511;and#1467;and#1491;and#1468;and#1493;and#1465;and#1514;).

    عدم وجود علامات التشكيل في نصوص الوثائق الإلكترونية سببه صعوبة استخدام تقنيات إضافة تلك العلامات وعدم معرفة الغالبية من محرري تلك الوثائق بكيفيتها،
    والمعروف أن لوحات الكتابة الإلكترونية (keyboards) بدأت بالحروف اللاتينية ثم زيدت عليها الحروف العربية وهي الأكثر عدداً فأدّى ذلك إلى توظيف مفتاحين يعملان معاً
    (Combination keys) لكل علامة تشكيل، زد على ذلك أن علامات التشكيل ذاتها غير مرغوب فيها في النصوص المرسلة العامة مثل الأخبار والروايات الطويلة
    فهي تبطيء من معدل القراءة بمضاعفة الوقت المطلوب لاستيعاب النص إلى ثلاث مرات تقريباً.(5)


    8. إهمال استخدام علامات الترقيم
    نتحدث هنا عن علامات الترقيم الظاهرة (punctuations) تمييزاً لها عن علامات ترقيم أخرى (tags) تستخدمها الكمبيوترات داخلياً لتهيئة العرض على الشاشة،
    اللغة العربية لم تعرف علامات الترقيم الحديثة إلا في مطلع القرن العشرين حوالي 1919م ومع ذلك فلا تستخدم تلك العلامات اليوم إلا على نطاق ضيق في المكاتبات الرسمية
    وغير ذلك هي ليست محكومة لا بتقليد متبع أو ضوابط موضوعة ومتروك أمرها بالكامل للكاتب وخلفياته التعليمية ومهاراته اللغوية والوصفية.
    علامات الترقيم يجب أن لا يعتد بها في التصنيف ولكنها وسيلة مساعدة ومهمة جداً رغم أننا لا نراها في النصوص التاريخية فلن نجد علامة الاستفهام ولا التعجب
    ولا حتى نقطة انتهاء السطر كما في (شرح ابن عقيل)، في مرحلة ما يجب أن يهتدي المصنف بعلامات الترقيم الظاهرة بافتراض سلامتها المنطقية والموضوعية
    وضمان تتابع فكرة النص (Topic integrity).


    9. الشذوذ اللغوي
    كون اللغة العربية مجرد لغة طبيعية يضعها مع لغات أخرى في ذات المرتبة بدون أدنى شك، وهذا يعني عدم سلامتها من الشذوذبكل مستوياته فهي ليست لغة اتفق الناس على صياغتها
    بطريق رسمية بل تطورت بالتداخل والتأثر بغيرها، وعندما نقول شذوذ فإننا نقصد عدم اتباع القواعد التي افترضها متحدثوها لوصفها بطريق علمية، وشذوذ اللغة العربية كثير ومتنوع
    فإذا افترضنا أن اللغة هي النص المكتوب فجموع التكسير شذوذ، والحروف الزائدة غير المنطوقة (مثل واو الجماعة وهمزة الوصل والواو المتطرفة في بعض أسماء الأعلام مثل
    "عمرو") شذوذ، ووحدة الرسم (Homopgraph) لطائفة كبيرة من أصناف الكلام (أسماء على وزن الأفعال والصفات مثل “أحمد”) يعتبر شذوذ، والسلوك الصرفي لأحرف العلة
    (الإقلاب) شذوذ، والإبدال والإعلال شذوذ، والاستثناءات الكثيرة (مثل المنع من الصرف) أيضاً شذوذ.

    وبالنسبة للظواهر الفونولوجية (الصوتية) فوجود حروف لا تنطق (اللام قبل الحرف الشمسي) وظهور أصوات لحروف غير موجودة أصلاً (التنوين، لكن، الذين، هؤلاء) وغيرها من
    المبني من الأسماء، هذا بالطبع يعيدنا إلى أمر الاختلافات الإقليمية والتي مردها إلى صعوبات النطق وربما مجرد تقليد لا يستند إلى قاعدة محددة فالجيم الخليجية والجيم الشامية
    والجيم والقاف القاهريتان مثال على ذلك، ولا تسلم اللغات الأوروبية من ذلك، فلا يوجد سبب منطقي يجعل متحدثي الفرنسية ينطقون بالحرف (R) كانه غيناً
    ولا سبب منطقي يجعل أهل أسبانياً ينطقون الحرف (J) خاءاً بينما ينطقه الألمان ياءاً اللهم إلا أن تكون أموراً تتعلق بالنظم الصوتية لهذه اللغات أو ربما ممارسات لغوية متوارثة.


    10. الأخطاء الشائعة
    الأخطاء اللغوية معظمها يؤثر في مرحلة التحليل الصرفي وبالتالي لها تأثير مباشر على مرحلة التصنيف أيضاً، مثلاً الفعلان السداسيان (استضاف واستبدل)
    والخماسيان (انصرف وابتدر) تبدأ بهمزات وصل لكن غالباً نجدها بهمزات قطع، ومثال آخر كذلك في مصر لا يعتد كثيراً بكتابة الياء المتطرفة (ي)
    وتكتب كأنها ألف مقصورة (ى) في معظم الكتابات وهذا متبع في اللغة الفارسية، في موريتانيا يضيفون همزة الوصل كتابة (امحمد، اسليماني)،
    في الشام يستخدمون مفردة (هكذا) بطريقة مميزة مثل (لجأت الحكومة إلى مثل <هكذا> سياسات لمصلحة الشعب)، لا يوجد حل سوى الأخذ بها كلها كيف جاءت
    فلا توجد اليوم مؤسسات لتقويم اللغة العربية وتصحيحها وإن وجدت فلن يتوفر لها من السلطة ما يمكنها من إجبار الناس على إتباع طريق معينة في استهلاك اللغة.


    التحميل الديني
    هنالك سبب إضافي آخر لكنه لا يندرج ضمن المجال البياني (نشاط الكتابة) بل بارتباطها الديني عموماً وهو “توهم قدسية اللغة العربية” وملخصه أن بعض من اللغويين يعطيها قداسة
    بسبب نزول الوحي بها وهو أمر غير منطقي إذ أن اللغات الطبيعية من صنع الانسان وفيها من الألفاظ ما يوجب الفصل والتمييز بينها وهبات الذات الإلهية،
    وكثيراً ما يصادف المرء مصطلح (لغة القرآن) أو (لغة أهل الجنة) وهو أمر لا يساعد في إيجاد حلول منطقية وفيه تحميل زائد وإيحاءات لا تمت لعلوم اللغات
    ولا إلى التناول الأكاديمي بصلة.

    ومع أن هذه المسألة عاطفية بالدرجة الأولى إلا أن ضررها لا يكمن فقط في الحكم بالمثالية المطلقة للغة العربية بل الحكم بها على وضاعة اللغات الأخرى وفي افتراض
    إعجاز بلاغي لا وجود له إلا في ذهن متحدثيها، أو افتراض وجود حلول ضمنية تأتي مع اللغة العربية نفسها ومن ألفاظها وتركيباتها أو من تلك النصوص المقدسة
    وهذا أمر غير صحيح مطلقاً وذات القائلين بقدسية اللغة يقررون عجز اللغات الأخرى عن استيعاب معاني اللغة العربية وأنها حافظت على أصالتها
    (رغم أن ذلك يضعها مع اللغات الميتة) وأنها بحر وغير ذلك من الأحكام الفردية المتطرفة البعيدة عن التناول الأكاديمي المقارن، بل قد يصل الأمر بالبعض إلى
    إدعاء أن اللغة العربية أصل اللغات جميعاً.(6)

    ________________
    الحواشي:
    (1) الميل الصرفي (Lexical Bias) مصطلح جديد يقترحه الكاتب للتحقيق في ظاهرة التفضيل الإملائي لمفردات ذوات صيغ صرفية محددة وقياس ذلك.
    (2) استخدام النسبة والنسب والكنية واللقب أضحت من الماضي رغم فوائدها، تقتصر اليوم على النسبة الجغرافية مثلاً (عدنان التكريتي) والعشائرية مثل (سعيد الهاجري).
    (3) التشتت الدلالي (Semantic Dispersion) مصطلح جديد يقترحه الباحث لقياس التباعد الدلالي بين المفردات من أصل واحد، ويتم التعبير عنه بقيمة بين الصفر والواحد، حيث الصفر يعبر عن الوحدة الدلالية لكل المفردات ذوات الصيغة الإملائية المشتقة من الجذر الواحد.
    (4) هنالك بالطبع اجتهادات قديمة ومحاولات مثل الاشتقاق الكبير والاشتقاق الأكبر ونعتقد أنها ليست مواكبة، فاللغات الطبيعية لا يتم تنظيمها قبلاً.
    (5) هذا الرقم غير مبني على دراسة علمية رسمية، بل بالتجربة البسيطة.
    (6) (اللغة العربية أصل اللغات كلها)، عبد الرحمن أحمد البوريني، الطبعة الأولى، دار الحسن للنشر والتوزيع، عمان-الأردن، رقم الإيداع 1875-12-1997.

    (عدل بواسطة حاتم إبراهيم on 08-26-2014, 09:34 AM)

                  

08-27-2014, 07:33 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    "وبذلك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..
    ارجو ان اجد الوقت للتفصيل... "
    --------------

    الأخ الأستاذ أبو الريش

    لا أزال انتظر التفصيل فهل تتكرم علينا به؟
                  

08-29-2014, 06:21 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    كتب أبو الريش:
    "لك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..
    ارجو ان اجد الوقت للتفصيل... "
    -----------------------

    أستاذ ابو الريش سلام
    الغموض المقصود هو (Ambiguity) وقد يبدو لبعض الناس أن المقصود هو (عدم وضوح المعنى)، هذا كلام غير علمي وغير محدد.
    ربما لأن ترجمة المصطلح بالعربية إلى (الغموض) غير مناسب.

    على أية حال المقصود: وجود معلومات أكثر من المطلوب بما يجعل المعنى غير محدد ويستلزم النظر إلى مدلولات لا تظهر على المستوى السطحي للجملة.

    فلذلك وعندما نقول أن اللغة العربية (غامضة) أو (Ambigious) فهذا لا يتعارض مع إرادة الآخرين أنها لغة ثرة و فيها "بلاغة" هذه البلاغة طبعاً شيء نسبي
    ويتوقف على حسب تعريف مصطلح "بلاغة" عند الناطقين باللغة.

    كذلك من المستحيل أن تصف لغة بأنها "مسطحة" مالم تكن قد مررت بكافة مراحل تعلمها الأولى، فلا أنا ولا أنت يمكننا الحكم على أية لغة مكتسبة عن طريق التعلموالتلقين، لكن بالطبع ستشعر بالفرق متى ما تعمقت في لغتك واكتشفت أن إيصال المعلومة بواسطتها يتطلب حشو النص بمفردات لا تضيف معنى بقدر ما تعمل
    على التأثير النفسي لدعم مطلبك، وربما تشوش على المستمع تماماً إذا كان غرضك هو إبراز مدى بلاغتك عندما تعمد إلى استخدام الاستعارات.
                  

08-29-2014, 12:13 PM

بريمة محمد
<aبريمة محمد
تاريخ التسجيل: 04-30-2009
مجموع المشاركات: 13471

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)


    حاتم،
    Quote: لغات ميتة (مثل الهيروغليفية والمسمارية وبعض اللغات التي تتحدث بها الأقليات).

    طيب ما ياهو أنت فاهم!
    موت الهيروغليفية يتبعه موت اللرطانات التى كتبت بأحرف هيروغليفية .. يعنى الرطانات السودان التى كتبت بالهيروغليفية .. عفى عنها الدهر .. ولا أنا غلطان.

    أين تقع الرطانات السودانية من اللغات التى تتحدث عنها؟

    بريمة
                  

08-29-2014, 04:27 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    بريمة سلام

    أولاً الهيروغليفية والمسمارية نظم كتابة وليست لغات كما فهمتها وربما أوحت لك العبارة بذلك لكن المقصود اللغات المعتمدة عليها
    وبالتأكيد ليست هناك علاقة (هذا إذا كنت قد واصلت قراءة المكتوب) وليس بالضرورة أن توقف العمل بالكتابة يستلزم موت اللغة
    اللغات النوبية مثلاً والتي كتبت في فترة باستخدام خليط من القبطية والمروية والإغريقية لم يتوقف الناس عن التحدث بها.

    واضح أنك تفهم أن اللغة هي الكتابة وهذا سوء فهم كبير ولكنه للأسف شائع ومع ذلك يجب أن لا يتوقع من المتعلمين أن يقعوا فيه، الاتحاد الأوروبي
    مثلاً فيه أكثر من عشرين لغة ومع ذلك يستخدمون نفس طقم أحرف الكتابة مع استثناءات يسيرة ومع ذلك لا نقول أن لغتهم هي اللاتينية لمجرد أن الحروف لاتينية.

    هنالك سبب واضح لعدم وجود نظم للكتابة للغات المحلية وهو فطري تتداخل فيه عوامل البيئة، لا تنشأ الحاجة لنظام تدوين إلا عند انتشار المجموعة السكانية
    أو تعقد حياتها، بالنسبة للمجموعات المحلية كانت تعيش في أوضاع سهلة نسبياً وتتواصل دون الحاجة للكتابة، لكن بالتأكيد تنشأ
    الحاجة لتدوين التاريخ وهذا مبحث طويل لكن المجموعات غير المستقرة دونت تاريخها بطرق مختلفة على هيئة أعمال أدبية ومنها أشعار "الحكامات" في مناطقكم يا بريمة وكذلك "الحَدَّاي" أو "الهَدَّاي" كما تنطقها أنت غالباً بحكم تاثير النظام الصوتي للغتك المحلية الأولى الغالبة.

    بالنسبة لسؤالك، لا أعتقد توجد لغات محلية في داخل الحدود السياسية للسودان الحالي استخدمت فيها الكتابة الهيروغليفية،
    وإذا كنت تنوي ربط موت اي لغة محلية بنص العبارة التي اقتبستها فإجابة سؤالك هي (نعم: أنت غلطان)، هذا لم يحدث ولن يحدث كما ذكرت لك، فالكتابة والنطق
    مجالان مختلفان ولم يحدث في تاريخ البشرية أن كانت لغة طبيعية تبدأ ومعها طقم كتابتها، أو ناسبت لغة أحرف كتابتها بالكامل أو حتى كان هناك تناسق تام
    بين اللغة والحروف التي تمثلها بما في ذلك اللغة العربية المعاصرة.

    كذلك، اللغات المحلية هي التي تحكم العامية السودانية حالياً بل لا تزال ترفد العربية بمفردات على نحو دائم، فهي تتفاعل معها على المستويات
    النحوي والمعجمي والدلالي.

    ملحوظة: هذا البوست يتحدث عن معالجة اللغة العربية بالكمبيوتر، كان بإمكانك الرد في البوست الذي خصصته أنت عن اللغة والقرآن.
                  

08-30-2014, 09:57 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    اللغة العربية (واللغات الطبيعية عموماً) ليست مرتبطة بالحروف المكتوبة، فلا الضاد (ض) ولا النون (ن) لهما علاقة بالصوت الذي نفترضه فيهما إلا في مخيلتنا
    وهذا أمر مدبر بعملية تعليم أساسي متكررة تستمر لفترة العشر سنوات الأولى من عمر المرء عندما لا يكون مدركاً أن الصورة والصوت أمران مختلفان تماماً
    ويظل (المعلم) يكرر له ذلك حتى يترسخ في وعيه أن الشكل (ض) هو أصل الصوت لحرف الضاد في اللغة العربية.
    وهذا يفسر لماذا يجد الكبار صعوبة في تعلم الكتابة والقراءة عند تخطي تلك السن المبكرة التي لا يميزون فيها بين المجالين، فالعقل الناضج لا ينخدع بأن للصورة صوت.

    وبناء على ذلك فلو أتيح للحيوانات أن تحرك شفاهها وألسنتها وحبالها الصوتية بحرية كما نفعل لنطقت ولحاورتنا، على الأقل على المستوى الفطري،
    أي في الحاجات الأساسية التي تجمعنا بها. فالمعلوم من ناحية تشريحية، لا يمنع الحيوانات تقليدنا سوى عدم مقدرتها على التحكم في ألسنتها وحبالها الصوتية كما نفعل.

    إذن فاللغة لها مجالان للتعبير يمكن معالجتهما بالكمبيوتر، والاثنان مجرد أعراض للغة وتمثيل لها أحدهما أقرب لحقيقتها والثاني مجرد صورة تمثيلية
    لما نعتقد أنه يعبر عنها ويرسلها لمسافة أبعد.

    لمعالجة اللغة العربية بل اللغات جميعاً لدينا خيارين:
    1- تحليل الصوت: تسجيل الكلام ثم العمل على تصنيفه ومحاولة إيجاد أنماط (patterns) يمكن ربطها بالمعاني والدلالات،
    وهنا تظهر تطبيقات توليد الكلام (Speech Synthesis) والتعرف على الصوت (Voice Recognition) وتحويل النص لصوت (Text to Speech).

    2- تحليل النص: وهو الأسهل بحسب طبيعة عمل الكمبيوتر ومقدرات الانسان التقنية الحالية في وضع النماذج والمعادلات، رصد النصوص وتصنيفها ومحاولة إيجاد مؤشرات
    (clues) يمكن أن تعطي دلالات على المعنى المطلوب على سبيل الترجيح، ومجال التطبيقات هنا واسع لكن كلها تقود في النهاية إلى الترجمة الآلية (Machine Translation) سواء كانت بين لغات مختلفة أو ضمن نفس اللغة أي عمليات تيسير النصوص (Text Abridgement) أو تصنيف الوثائق (Document Clustering). وتطبيقات نشطة أخرى مثل استخراج المعلومات من النصوص الطبيعية (Information Retreival).

    الشيء الغريب أن البشر يطورون التقنيات لتيسير العودة إلى فطرتهم الأولى، فتطبيقات مثل تحويل النص لصوت تعني أن الهدف هو الاستغناء عن قراءة النص وإلغاء كل المرحلة
    الوسيطة التي اخترعها الانسان عبر أجيال ليكتفي بالاستماع، هناك تطبيقات أخرى تعمل على تحويل الكلام من لغة إلى لغة أخرى مباشرة بما يعني أنه سيأتي وقت
    يمكنك أن تخاطب شخص ما في طرف الكرة الأرضية بلغتك المحلية فيسمع هو في نفس الوقت كلامك بلغته الأم التي ربما تكون الصينية أو النافاهو.
                  

09-06-2014, 03:18 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    Quote:
    "لذلك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..
    ارجو ان اجد الوقت للتفصيل... "


    الأخ الباشمهندس أبو الريش

    انتظر منذ أسبوعين أن تأتي وتكتب ما تيسر حتى نستفيد، كذلك أتمنى أن أعرف طريقتك في تقييم اللغات و "وزنها".
                  

10-13-2014, 08:47 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، مقدمة (Re: حاتم إبراهيم)

    Quote:
    "لذلك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..
    ارجو ان اجد الوقت للتفصيل... "


    الأخ الباشمهندس أبو الريش

    انتظر منذ شهر ونصف أن تأتي وتكتب ما تيسر حتى نستفيد، كذلك أتمنى أن أعرف طريقتك في تقييم اللغات و "وزنها".
                  


[رد على الموضوع] صفحة 1 „‰ 1:   <<  1  >>




احدث عناوين سودانيز اون لاين الان
اراء حرة و مقالات
Latest Posts in English Forum
Articles and Views
اخر المواضيع فى المنبر العام
News and Press Releases
اخبار و بيانات



فيس بوك تويتر انستقرام يوتيوب بنتيريست
الرسائل والمقالات و الآراء المنشورة في المنتدى بأسماء أصحابها أو بأسماء مستعارة لا تمثل بالضرورة الرأي الرسمي لصاحب الموقع أو سودانيز اون لاين بل تمثل وجهة نظر كاتبها
لا يمكنك نقل أو اقتباس اى مواد أعلامية من هذا الموقع الا بعد الحصول على اذن من الادارة
About Us
Contact Us
About Sudanese Online
اخبار و بيانات
اراء حرة و مقالات
صور سودانيزاونلاين
فيديوهات سودانيزاونلاين
ويكيبيديا سودانيز اون لاين
منتديات سودانيزاونلاين
News and Press Releases
Articles and Views
SudaneseOnline Images
Sudanese Online Videos
Sudanese Online Wikipedia
Sudanese Online Forums
If you're looking to submit News,Video,a Press Release or or Article please feel free to send it to [email protected]

© 2014 SudaneseOnline.com

Software Version 1.3.0 © 2N-com.de