تحليل اللغة العربية بالكمبيوتر، الجزء الثاني

دعواتكم لزميلنا المفكر د.الباقر العفيف بالشفاء العاجل
مرحبا Guest
اخر زيارك لك: 12-13-2024, 07:46 PM الصفحة الرئيسية

منتديات سودانيزاونلاين    مكتبة الفساد    ابحث    اخبار و بيانات    مواضيع توثيقية    منبر الشعبية    اراء حرة و مقالات    مدخل أرشيف اراء حرة و مقالات   
News and Press Releases    اتصل بنا    Articles and Views    English Forum    ناس الزقازيق   
مدخل أرشيف للعام 2015م
نسخة قابلة للطباعة من الموضوع   ارسل الموضوع لصديق   اقرا المشاركات فى شكل سلسلة « | »
اقرا احدث مداخلة فى هذا الموضوع »
08-26-2015, 11:35 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
تحليل اللغة العربية بالكمبيوتر، الجزء الثاني

    12:35 PM Aug, 26 2015
    سودانيز اون لاين
    حاتم إبراهيم-
    مكتبتى فى سودانيزاونلاين



    Quote:
    نقلا عن بوست سابق
    http://sudaneseonline.com/board/470/msg/1408906921.html
    أسباب صعوبة المعالجة الآلية للغة العربية

    تتعدد التطبيقات ولكن النتائج المتقاربة للمصنفات تدل على شيء واحد، تشابه الأساليب، وهذا سببه بعض من الصعوبة في فهم الأساسيات المتعلقة منها باللغة أو طريقة عمل الكمبيوتر، ومعظم هذه الصعوبات منسوب إلى طبيعة اللغة العربية إضافة إلى أسباب أخرى تعود إلى مستهلكيها، نسرد هنا الأسباب كلها والتي توصلنا إليها من خلال المتابعة الدائمة والمراقبة لكل ما يستجد في هذا المضمار:

    1. تعدد الطبقات
    بعض اللغات ثنائية الطبقات (Diglossic) هذا يعني أن الناطقين باللغة يعتمدون نوعين منها واحدة للصفوة وأخرى للعوام هذا ليس تقسيماً اجتماعياً بل ثقافي
    فأي من الفئتين يمكنه استعمال الطبقة التي تعجبه في أي موقف، اللغة العربية ثلاثية الطبقات (Triglossic)، فمنها لغة كلاسيكية منضبطة المكتوب بها القرآن والأعمال الأدبية
    مثل الشعر الجاهلي ثم لغة أبسط “فصحى” وهي لغة الصحافة والإعلام، إضافة إلى لغة عامية تتباين بحسب عوامل جغرافية واجتماعية عدة
    (أسمينا كل طبقة “لغة” لأن أي منها له هياكله البنائية والنحوية والدلالية مثل أي لغة حقيقية). الصعوبة في هذا الأمر أن التداخل بين الطبقات الثلاث يحدث دائماً
    سيما لا توجد دولة عربية يتحدث سكانها الفصحى في أمور الشأن العام وكذلك لا تخلو مداولات الشأن الخاص من التعرض لبعض مكونات الفصحى
    كالاقتباس من المصادر الثقافية التاريخية، وقد تأتي العامية في مقام الفصحى، فالعامية المصرية مثلاً تستخدم رسمياً في الإعلام،
    ويحدث تأثير وتداخل بين الطبقات الثلاث على المستوى الصرفي، في النصوص المغاربية مثلاً يأتي ذكر (بحبوش، كنبغيك، لحْسَن) أحياناً في كتابات رسمية.


    2. تأثير اللغات الأخرى
    هذه ليست مشكلة تخص اللغة العربية منفردة فكل اللغات تتداخل طبيعياً، التداخل المعجمي باستعارة الألفاظ والمصطلحات والتداخل النحوي بتبني القواعد النحوية
    (كما في العامية السورية واللبنانية باستعارة قواعد الآرامية، وباستعارة قواعد الأمازيغية في اللغات العامية في المغرب العربي وباستعارة قواعد القبطية في العامية المصرية
    أو حتى في اللغات الأوروبية المعاصرة فالفرنسية مثلاً استعارت من قواعد اللاتينية بينما أكثرت اللغة الإيطالية من الاستعارة من مفرداتها، والأهم من ذلك الترجمة الحرفية
    التي تحدث بسبب عدم مواكبة اللغة لمستحدثات العلوم المختلفة، مصطلح (محرك بحث) مثلاً ترجمة حرفية لمصطلح (Search Engine) وإعادة توطين مفردات تم تغريبها
    مثل (خوارزمية وألغوريثم)، وقد يحدث التداخل بين منطقتين متباعدتين جغرافياً بسبب الهجرات القديمة أو الحديثة المنظمة فسواحل الخليج (الإمارات وعمان والبحرين وقطر)
    تشهد التداخل بين اللغة العربية والأردو والهندية والفارسية وهذا ينتج عنه لغة هجينة (Creole) تفرضها ظروف التفاعل الاقتصادي.


    3. تعدد الاختلافات الإقليمية
    ربما تكون هذه أكبر مشكلة مخفية حتى الآن، فالنص العربي ينتشر في بقعة واسعة ويتم التعامل معه كل باختلاف ثقافته وتفضيلاته المحلية، وبالمقارنة فاللغة الصينية تتوزع باختلافات
    يسيرة في تايوان وهونغ كونغ والصين والإنجليزية ينحصر اختلافها الكبير بين بريطانيا وأمريكا وعلى نحو أقل في استراليا وكندا والهند وجنوب أفريقيا، بينما العربية تتعدد اختلافاتها
    بقدر عدد الدول الناطقة بها، المؤسف أن هذه الاختلافات الإقليمية توجد في أهم طبقة وهي العربية الفصحى المستعملة في الوسائل الإعلامية وهي تمثل نسبة كبيرة من النصوص
    العربية المتوفرة اليوم على هيئة مكانز (مدونات) وهي المستهدفة بالمعالجة.

    من الواضح أن الاختلافات هنا أسبابها ثقافية تتعلق بالمنطقة الحضرية وتأثرها بالبيئة حولها وتظهر جلية في المفردات الحديثة الوافدة مثل (موبايل) وهذا يوجد أيضاً على مستويات
    أخرى إملائية مثلاً غوغول تكتب (قوقل، غوغل، جوجل، گوگل، and#1891;وand#1891;ل) في السعودية ومصر والعراق والمغرب، ومن أسبابها الأخرى الميل الصرفي (Lexical Bias) (1) وهو
    تفضيل صيغ صرفية محددة على غيرها، فمثلاً الشائع في اللغة استخدام مفردة "محطَّم" وليس "محطوم" رغماً عن صحتها لغوياً ومناسبتها للوصف فهي اسم مفعول مثل (مهزوم)،
    ويستخدم البعض اللفظ "مربوح" وهو نادر إلا في المغرب العربي، ولهذا ذكرنا قبلاً أن فرط توليد المفردات قد لا يكون ميزة إيجابية إذا لم يتفق الناس على كيفية الاستفادة منه،
    فلا يمكن تعميم القالب الصرفي على أي مفردة، إذن لحصلنا على كلمات تبدو (غريبة) للبعض مثل “مرغوم، كاسور، جابن، مخواف، كواذب، زبناء، رابوط، ضوارب، شبيع”.

    الأمر الجيد أن في اللغة العربية متسع من هذه الحيل، والأمر ليس كله سوء، فلو تتبعنا النواتج غير المستخدمة من فضْلات تطبيق النظام الصرفي لأمكن حل مشاكل عديدة
    أولها إيجاد مقابلات للمفردات الحديثة الوافدة من اللغات الأخرى والتي أوفرها ما يستخدم في الحاجات الأساسية للبشر حيث تختلف الأسماء بسبب أن مسمياتها غالباً ما تنتشر جغرافياً
    في ذات الوقت، الميل الصرفي لا علاقة له بالترادف، الإنجليز مثلاً يستخدمون المصطلحات (Lift, Petrol, Tube) لتسمية المصعد والوقود وقطار الأنفاق
    بينما الأمريكان يقولون (Elevator, Gas, Subway) لذات المسميات، الحل باستخدام حلول معجمية فالأسماء مجالها واسع ولا يوجد غير الحل المعجمي.


    4. عدم وجود فوارق شكلية واضحة بين مكونات النص
    بعض اللغات تميز أجزاء الكلام بأنواع مختلفة من الحروف واللواصق (Affixes)، فالإنجليزية مثلاً تستخدم الأحرف الكبيرة لتمييز طائفة الأسماء والأعلام (Proper nouns)
    ثم مقاطع غيرها تحدد بشكل واضح نوع المفردة بنحو أدق مصدراً كانت أو صفة أو نسبة مثل (tion, ty, ed, ese, ing)، بل أضافت مقاطع من اللاتينية ذات معنى
    مثل (pro, ex, mal, para, con) لذا فإن طائفة المشذبات (Stemmers) تعمل معها بنجاح تام، واليابانية تستخدم ثلاث أطقم من الحروف أحدها (يسمى كاتاكانا)
    مخصص بالكامل للمفردات الدخيلة عليها فإذا أرادوا ذكر الرئيس الأمريكي باراك أوباما كتبوا (and#12496;and#12521;and#12463;·and#12458;and#12496;and#12510;) كذلك لها بنية ثابتة للجملة تميز أجزاء الكلام على المستوى النحوي.

    العربية تستخدم ذات المفردات لشتى الأغراض فهي أحياناً أسماء (صفات، أعلام) وحين آخر أفعال وتعتمد فقط على الأوزان (Morphological Templates) التي تستخدمها عدة
    لغات مثل العبرية واليابانية، وبعض الأفعال المساعدة والنواسخ والجوامد والظروف وتستخدم بعض الأسماء للاعلام (أبو، ابن إضافة للنسبة والنسب) ومثالنا (شرب أحمد الحليب)
    كان معبراً تماماً عن هذه المشكلة التي ينتج عنها خلل على المستويين النحوي والدلالي.(2)
    فبالنسبة للكمبيوتر فإن أي من المفردات (شرب، أحمد) يمكن أن تكون فعل أو صفة بينما (الحليب) يمكن أن تكون اسم علم، وكل الجملة (شرب أحمد الحليب) يمكن في أقصى
    الحالات أن تكون اسماً كاملاً يماثل (فهد أحمد الخطيب) إملائياً.



    5. إفتقار اللغة العربية لمبدأ الوحدة الدلالية
    تقوم اللغة العربية صرفاً وإملاء على مبدأ الاشتقاق (Inflection) بالبناء على الجذر، وهي تشترك في هذه الميزة مع بقية لغات العائلة السامية (الآرامية والعبرية)
    والأفريقية السامية (التغرينيا والأمهرية)، كل جذر ثلاثي صحيح يمكن أن يشتق منه حوالي 30 ألف مفردة نظرياً (مع كل الزوائد الاشتقاقية والصرفية الممكنة)،
    كان يمكن أن يقدم الجذر خدمة عظيمة للغة لو كانت مشتقاته تتفق كلها دلالياً لكن للأسف هذا لا ينطبق إلا على فئة محدودة من الجذور،
    مبدأ الوحدة الدلالية (ٍSemantic Consistency) معيار جديد من اقتراح الباحث وهو يوظف الدلالة التكوينية (Ontology) وله قياسات حسابية كمية
    يستعملها المصنف الموسع (Deep Tagger) ويختلف عن الترادف (Synonymy) الذي يبحث في مطابقة المعنى أو التناظر الذي يبحث في تباين المعنى مثل
    (درس التمليذ الواجب) و (درس الحمار الشعير)، أنظر أدناه لنموذجين للجذرين (ضرع) و(بلغ)،

    اللغة العربية تتصف بالتشظي الدلالي (Semantic Dispersion) أو التشتت الدلالي(3) الذي يحسب ثراءاً بلاغياً في اللغة لكنه ليس في مصلحة أي تطبيق لمعالجة النصوص
    بأسلوب منطقي يستقي مقدماته من اتساق معاني المفردات المشتقة من أصل وحيد، فإن كانت ذات معامل تشتت كبير فهي إذن مختلفة الدلالات ولن يصلح الأمر إلا بتوليد كل المفردات
    المحتملة للجذر ومضاهاتها بمقابلاتها في اللغة المستهدفة. عملية توليد كل الاشتقاقات تنتج ما يعرف بالقاموس التام (Full Form Dictionary) وهي المشكلة التي أشرنا إليها سابقاً
    إذ أن توليد 30 ألف مفردة لا يتطلب شيئاً يذكر في الكمبيوترات الحديثة من ناحية الحفظ في الذاكرة ولكنها تسبب تأخيراً بائناً إذا وجب توليدها ضمن برنامج تنسيق نصوص لدعم ميزة
    التصحيح الإملائي مثلاً، كذلك وجود هذا الكم الكبير من المفردات بلا رابط يجمعها دلالياً لا فائدة منطقية ترجى منه.(4)

    التشتت الدلالي مشكلة باقية (Persistent) من أصل اللغة أي أنها غير ذات ارتباط بالعصور المختلفة لتطور اللغة ومدى تداخلها المعاصر مع التطور الحياتي البشري الذي يسبب
    انزياح المعنى، فمصطلحات معاصرة مثل (عربة، حافلة، سيارة) لا يجوز التسرع في الحكم بمدلولاتها بمعزل عن السياق الزمني للنصوص التي وردت فيها فهي “معروفة” اليوم
    ولكن لها دلالاتها المختلفة إذا جاءت ضمن نصوص أدبية قديمة كما في الشعر الجاهلي فكلمة (حافلة) آنذاك لم تكن أبداً مركبة تسير على أربع أو ست عجلات،
    هذا يسمى انزياح المعنى (Semantic Shift)، ولكن اللغة العربية أصلاً تفتقر للوحدة الدلالية فحتى مفردات شائعة مثل “ضرب” والتي تنتمي لذات الجذر مع أخريات
    (ضَرْب، ضريب، مضارب، ضِراب، ضُروب، إضراب، ضريبة) لا تسلم من هذه المشكلة بدون أن نتطرق حتى لدلالاتها المعاصرة.
    لن تكون اللغة الطبيعية معيارية أبداً وإن كتبت بها النصوص الدينية لسبب بسيط وهي أنها تعبر عن محمولات ثقافية شفاهية معاصرة لزمان معين، وواحدة من المشاكل
    أن النص المكتوب في اللغات الأبجدية يفترض فيه أنه يكون تمثيلاً للصوت ولكن الصوت ذاته ليس معياراً فالكلمة الواحدة يمكن أن تنطق بأكثر طريقة
    حتى بين أفراد العائلة الواحدة في نطاق جغرافي واحد.


    6. الاستخدام المفرط للاستعارات
    هذه واحدة من المشاكل في كل اللغات لكنها في اللغة العربية من أكبرها وتظهر جلية وبائنة لأي دارس مبتدئ، ولا تكاد تخلو أي فقرة مكتوبة منها،
    ومشكلة الاستعارات (m e t a ph o r s) أنها لا تضيف معلومة بقدر ما تعمل على تحسين الخصائص البلاغية للنص أو التأثير العاطفي على المتلقي بإضافة المؤثرات النفسية
    مثال الجملتين (رزق فلان بفارس) و (أزاحت الشركة الستار) فأيهما لا تشير دلالياً أو نحوياً من قريب أو بعيد إلى حدوث الولادة أو إعلان بدء التسويق لمنتج تجاري،
    بل تعتمدان على المقاربة البلاغية باستخدام الاستعارات المركبة التي تعتمد بالكامل على الخبرات اللغوية للمتلقي وحسن تفسيره للمعنى بناء على ثقافته
    وهو أمر يخرج عن سيطرة الكمبيوتر أو أي تطبيق برمجي يعمل على أساس التحليل المنطقي المباشر المعتمد على النص المرسوم.
    بل حتى على مستوى الوصف المباشر توجد مفردات نحسبها واضحة وهي غير ذلك، مثلاً الصفتان “أبيض” و”بيضاء” ليستا وصفاً للون فحسب بل الشكل والحجم أيضاً
    (إذا عممنا) القاعدة، فالصفتين أصلهما من الاسم “بيض”.


    7. عدم وجود علامات التشكيل
    علامات التشكيل هي الطقم الثاني من رموز تدوين اللغة العربية ويجب أن تعتبر حروف من وجهة نظر أي تطبيق لمعالجة النصوص العربية،
    فهي لها شكل (Grapheme) وقواعد إملائية ولا تختلف فعلياً عن الحروف الأخرى إلا في قلة استخدامها، وعند مقارنتها بالحروف الأساسية للغة العربية فهي صوائت قصيرة
    (Short Vowels) وتستوي اللغة العربية في هذه الميزة مع اللغة العبرية الحديثة (تسمى بالإسرائيلية)، فاليهود يهملون التشكيل بالتنقيط ويسمون علامات التشكيل عندهم
    نِيقوط (and#1504;and#1456;and#1511;and#1467;and#1491;and#1468;and#1493;and#1465;and#1514;).

    عدم وجود علامات التشكيل في نصوص الوثائق الإلكترونية سببه صعوبة استخدام تقنيات إضافة تلك العلامات وعدم معرفة الغالبية من محرري تلك الوثائق بكيفيتها،
    والمعروف أن لوحات الكتابة الإلكترونية (keyboards) بدأت بالحروف اللاتينية ثم زيدت عليها الحروف العربية وهي الأكثر عدداً فأدّى ذلك إلى توظيف مفتاحين يعملان معاً
    (Combination keys) لكل علامة تشكيل، زد على ذلك أن علامات التشكيل ذاتها غير مرغوب فيها في النصوص المرسلة العامة مثل الأخبار والروايات الطويلة
    فهي تبطيء من معدل القراءة بمضاعفة الوقت المطلوب لاستيعاب النص إلى ثلاث مرات تقريباً.(5)


    8. إهمال استخدام علامات الترقيم
    نتحدث هنا عن علامات الترقيم الظاهرة (punctuations) تمييزاً لها عن علامات ترقيم أخرى (tags) تستخدمها الكمبيوترات داخلياً لتهيئة العرض على الشاشة،
    اللغة العربية لم تعرف علامات الترقيم الحديثة إلا في مطلع القرن العشرين حوالي 1919م ومع ذلك فلا تستخدم تلك العلامات اليوم إلا على نطاق ضيق في المكاتبات الرسمية
    وغير ذلك هي ليست محكومة لا بتقليد متبع أو ضوابط موضوعة ومتروك أمرها بالكامل للكاتب وخلفياته التعليمية ومهاراته اللغوية والوصفية.
    علامات الترقيم يجب أن لا يعتد بها في التصنيف ولكنها وسيلة مساعدة ومهمة جداً رغم أننا لا نراها في النصوص التاريخية فلن نجد علامة الاستفهام ولا التعجب
    ولا حتى نقطة انتهاء السطر كما في (شرح ابن عقيل)، في مرحلة ما يجب أن يهتدي المصنف بعلامات الترقيم الظاهرة بافتراض سلامتها المنطقية والموضوعية
    وضمان تتابع فكرة النص (Topic integrity).


    9. الشذوذ اللغوي
    كون اللغة العربية مجرد لغة طبيعية يضعها مع لغات أخرى في ذات المرتبة بدون أدنى شك، وهذا يعني عدم سلامتها من الشذوذبكل مستوياته فهي ليست لغة اتفق الناس على صياغتها
    بطريق رسمية بل تطورت بالتداخل والتأثر بغيرها، وعندما نقول شذوذ فإننا نقصد عدم اتباع القواعد التي افترضها متحدثوها لوصفها بطريق علمية، وشذوذ اللغة العربية كثير ومتنوع
    فإذا افترضنا أن اللغة هي النص المكتوب فجموع التكسير شذوذ، والحروف الزائدة غير المنطوقة (مثل واو الجماعة وهمزة الوصل والواو المتطرفة في بعض أسماء الأعلام مثل
    "عمرو") شذوذ، ووحدة الرسم (Homopgraph) لطائفة كبيرة من أصناف الكلام (أسماء على وزن الأفعال والصفات مثل “أحمد”) يعتبر شذوذ، والسلوك الصرفي لأحرف العلة
    (الإقلاب) شذوذ، والإبدال والإعلال شذوذ، والاستثناءات الكثيرة (مثل المنع من الصرف) أيضاً شذوذ.

    وبالنسبة للظواهر الفونولوجية (الصوتية) فوجود حروف لا تنطق (اللام قبل الحرف الشمسي) وظهور أصوات لحروف غير موجودة أصلاً (التنوين، لكن، الذين، هؤلاء) وغيرها من
    المبني من الأسماء، هذا بالطبع يعيدنا إلى أمر الاختلافات الإقليمية والتي مردها إلى صعوبات النطق وربما مجرد تقليد لا يستند إلى قاعدة محددة فالجيم الخليجية والجيم الشامية
    والجيم والقاف القاهريتان مثال على ذلك، ولا تسلم اللغات الأوروبية من ذلك، فلا يوجد سبب منطقي يجعل متحدثي الفرنسية ينطقون بالحرف (R) كانه غيناً
    ولا سبب منطقي يجعل أهل أسبانياً ينطقون الحرف (J) خاءاً بينما ينطقه الألمان ياءاً اللهم إلا أن تكون أموراً تتعلق بالنظم الصوتية لهذه اللغات أو ربما ممارسات لغوية متوارثة.


    10. الأخطاء الشائعة
    الأخطاء اللغوية معظمها يؤثر في مرحلة التحليل الصرفي وبالتالي لها تأثير مباشر على مرحلة التصنيف أيضاً، مثلاً الفعلان السداسيان (استضاف واستبدل)
    والخماسيان (انصرف وابتدر) تبدأ بهمزات وصل لكن غالباً نجدها بهمزات قطع، ومثال آخر كذلك في مصر لا يعتد كثيراً بكتابة الياء المتطرفة (ي)
    وتكتب كأنها ألف مقصورة (ى) في معظم الكتابات وهذا متبع في اللغة الفارسية، في موريتانيا يضيفون همزة الوصل كتابة (امحمد، اسليماني)،
    في الشام يستخدمون مفردة (هكذا) بطريقة مميزة مثل (لجأت الحكومة إلى مثل (هكذ) سياسات لمصلحة الشعب)، لا يوجد حل سوى الأخذ بها كلها كيف جاءت
    فلا توجد اليوم مؤسسات لتقويم اللغة العربية وتصحيحها وإن وجدت فلن يتوفر لها من السلطة ما يمكنها من إجبار الناس على إتباع طريق معينة في استهلاك اللغة.


    التحميل الديني
    هنالك سبب إضافي آخر لكنه لا يندرج ضمن المجال البياني (نشاط الكتابة) بل بارتباطها الديني عموماً وهو “توهم قدسية اللغة العربية” وملخصه أن بعض من اللغويين يعطيها قداسة
    بسبب نزول الوحي بها وهو أمر غير منطقي إذ أن اللغات الطبيعية من صنع الانسان وفيها من الألفاظ ما يوجب الفصل والتمييز بينها وهبات الذات الإلهية،
    وكثيراً ما يصادف المرء مصطلح (لغة القرآن) أو (لغة أهل الجنة) وهو أمر لا يساعد في إيجاد حلول منطقية وفيه تحميل زائد وإيحاءات لا تمت لعلوم اللغات
    ولا إلى التناول الأكاديمي بصلة.

    ومع أن هذه المسألة عاطفية بالدرجة الأولى إلا أن ضررها لا يكمن فقط في الحكم بالمثالية المطلقة للغة العربية بل الحكم بها على وضاعة اللغات الأخرى وفي افتراض
    إعجاز بلاغي لا وجود له إلا في ذهن متحدثيها، أو افتراض وجود حلول ضمنية تأتي مع اللغة العربية نفسها ومن ألفاظها وتركيباتها أو من تلك النصوص المقدسة
    وهذا أمر غير صحيح مطلقاً وذات القائلين بقدسية اللغة يقررون عجز اللغات الأخرى عن استيعاب معاني اللغة العربية وأنها حافظت على أصالتها
    (رغم أن ذلك يضعها مع اللغات الميتة) وأنها بحر وغير ذلك من الأحكام الفردية المتطرفة البعيدة عن التناول الأكاديمي المقارن، بل قد يصل الأمر بالبعض إلى
    إدعاء أن اللغة العربية أصل اللغات جميعاً.(6)

    ________________
    الحواشي:
    (1) الميل الصرفي (Lexical Bias) مصطلح جديد يقترحه الكاتب للتحقيق في ظاهرة التفضيل الإملائي لمفردات ذوات صيغ صرفية محددة وقياس ذلك.
    (2) استخدام النسبة والنسب والكنية واللقب أضحت من الماضي رغم فوائدها، تقتصر اليوم على النسبة الجغرافية مثلاً (عدنان التكريتي) والعشائرية مثل (سعيد الهاجري).
    (3) التشتت الدلالي (Semantic Dispersion) مصطلح جديد يقترحه الباحث لقياس التباعد الدلالي بين المفردات من أصل واحد، ويتم التعبير عنه بقيمة بين الصفر والواحد، حيث الصفر يعبر عن الوحدة الدلالية لكل المفردات ذوات الصيغة الإملائية المشتقة من الجذر الواحد.
    (4) هنالك بالطبع اجتهادات قديمة ومحاولات مثل الاشتقاق الكبير والاشتقاق الأكبر ونعتقد أنها ليست مواكبة، فاللغات الطبيعية لا يتم تنظيمها قبلاً.
    (5) هذا الرقم غير مبني على دراسة علمية رسمية، بل بالتجربة البسيطة.
    (6) (اللغة العربية أصل اللغات كلها)، عبد الرحمن أحمد البوريني، الطبعة الأولى، دار الحسن للنشر والتوزيع، عمان-الأردن، رقم الإيداع 1875-12-1997.

    طيب يا أبوريش، معليش اتأخرنا عليك

    نسخت الجزء المتعلق من البوست المعني فوق، لأنك ما "بتخش لنكات" زي ما قلت قبل كدة.
    عموماً، يهمني من عبارتك الإجابة عن الآتي:
    1- على أي أساس بنيت اعتقادك بأن الكاتب (شخصي) اعتمد على المقارنة مع اللغة الإنجليزية في الاستدلال على النتائج المبينة؟
    2- مصطلح (ما عنده سنج يوزن بيها) يبين تلميحاً بأن هناك معايير لتقييم أعراض اللغات الطبيعية، فهل حدثتنا عن هذه المعايير أو "السنج" مع توضيح كيفية تطبيقها؟

    تنبيه: أنصحك بتجنب التناول العاطفي عند الحديث عن اللغات، أو تبني افتراضات مسبقة.

    أنا حأغيب يومين تلاتة، أخد راحتك يا باشمهندس
                  

08-29-2015, 07:39 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: سلام يا حاتم،
    موضوع مهم لا شك.. ولكن واضح ان الكاتب قد أخذ لغـة معينة، قد تكون الإنجليزية كنظام إسناد ليقيم وفق
    منهجها اللغـة العربيـة.. وبذلك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..
    ارجو ان اجد الوقت للتفصيل...

    في انتظارك يا أبوريش
    انت تصديت كالعادة بالتشكيك، لكن المألوف عنك (حسب ما بدأ لي شخصياً) هو الهجوم غير المؤسس أو حتى المبني على معلومة صحيحة، ثم عدم العودة لمناقشة ما كتبت أو حتى الدفاع عنه، هذا في رأيي المتواضع سلوك غير لائق في التعاطي مع مسائل أكاديمية.
    فتفضل دافع عن طرحك المقتبس أعلاه، وهو قد أتم العام بزيادة ثلاثة أيام، اعتقد فترة كافية من الوقت.
    Re: تحليل اللغة العربية بالكمبيوتر، مقدمةRe: تحليل اللغة العربية بالكمبيوتر، مقدمة
                  

08-29-2015, 07:52 AM

Abureesh
<aAbureesh
تاريخ التسجيل: 09-22-2003
مجموع المشاركات: 30182

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Thanks Hatim

    It's interesting topic and will come back to it.. sorry I am not on the Arabic computer
                  

08-29-2015, 08:10 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote:
    Thanks Hatim

    It's interesting topic and will come back to it.. sorry I am not on the Arabic computer

    Hi, welcome back!
    In fact, I would rather prefer discussing this in English!
    Perhaps you would like to refer to the English version here

    http://www.academia.edu/7659052/Stateful_Augmented_Sliding_Window_based_Arabic_Pos_Tagging


                  

08-29-2015, 08:37 AM

عبدالحفيظ ابوسن
<aعبدالحفيظ ابوسن
تاريخ التسجيل: 06-24-2013
مجموع المشاركات: 22319

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    تحياتي حاتم وضيوفك
    لست متخصصا ولكن لدي ملاحظات ارجو ان لا تكون خارج نطاق البوست وهدفه
    اللغة الانجليزية حسب تعريفك لديها اكثر من طبقة .. فتلك الموجودة في انجلترا تختلف عن مثيلاتها في بعض الدول الناطقة بالانجليزية .. وكما توجد لغة عربية قديمة كذلك توجد انجليزية قديمة ومكتوبا بها اعظم الروايات مما استدعي ترجمتها للغة انجليزية فصيحة حديثة ان جاز التعبير .. وايضا توجد لغة شارع ولغة صحافة .. فكثيرا ما اعجز عن فهم بعض الكلمات الدارجة في الروايات الامريكية والايرلندية ويعجز معي القاموس فأميل للكومن سينس .
    اللغة العربية بلاشك معقدة .. اعتمادها احيانا علي التنوين .. فكلمة واحدة قد يتباين معناها بالضمة او الفتحة
    ارجو ان لا اكون خرجت عن نطاق البوست
    متابع بشغف
    مع اكيد المودة
                  

08-29-2015, 08:39 AM

Abureesh
<aAbureesh
تاريخ التسجيل: 09-22-2003
مجموع المشاركات: 30182

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: In fact, I would rather prefer discussing this in English!
    Perhaps you would like to refer to the English version here


    عدنا للكمبيوتر العربى.. وطبعا زول يناقش لغة لا بد يأتى بنصوص منها للتدليل على وجهـة نظره.. لكن النقاش العام سيكون بالعربية..

    بعدين اريد ان الفت نظرك.. فى نقاشات مثل هذه الهدف يجب ان يكون الوصول للحقيقة وليس الإنتصار لوجهـة النظر. والسعى فى النقاش من أجل الإنتصار محكوم عليه مفارقـة الموضوعية فى نقطة ما. فنحن مثل الذين ينقبون عن الذهب.. لو لقيت انت عرق ذهب
    فسأتوقف انا واحاول اصل معك لإتفاق لتقاسمه لأننا كنا نحفر فى ذات المكان.. وكذلك أنت.. والان نحن نبحث عن الحقيقة ومن يجدها عند الاخر يحاول يفهما منه ليستفيد منها ايضا (تقاسم الذهب).
    سارد على اسئلتك هناك، بس اليومين دى مشغول مع الأخذ فى ال‘تبار ان ما طرحته من اسئلة يحتاج الى روية فى الكتابة وجهد فى إيضاح الرأى.
                  

08-31-2015, 07:21 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: لست متخصصا ولكن لدي ملاحظات ارجو ان لا تكون خارج نطاق البوست وهدفه

    بل في نطاق لابوست
    مرحبا أخ عبد الحفيظ
    وشكرا على المداخلة، سأرد عليها بتوسع أكثر ربما في الغد
    آمل أن لا يتأخر علينا باشمهندس أبوريش
                  

09-02-2015, 03:48 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: ولكن واضح ان الكاتب قد أخذ لغـة معينة، قد تكون الإنجليزية كنظام إسناد ليقيم وفق
    منهجها اللغـة العربيـة.. وبذلك جاء ما أورده من عيوب اللغـة العربية، بسبب حشوها في منهجيـة أساسا متخلفـة عن
    اللغة العربيـة.. ما عنده (سنـج) يوزن بيها اللغة العربيـة.. مثلا حين يقول العربيـة غامضـة، يستطيع اخر ان
    يقول الإنجليزية لغـة مسطحـة لا عمق فيها..

    شكلك حتتزاوغ سنة تانية!
    أها يا أبوريش؟
    شايفك بتتغافل عن الموضوع دا كالعادة
    هل سيطول انتظارنا حتى تتكرم بتفسير جملتك أو الدفاع عنها؟

    لو ما عارف تبدأ من وين أهي دي موجهات عامة:
    1- على أي أساس بنيت اعتقادك بأن الكاتب (شخصي) اعتمد على المقارنة مع اللغة الإنجليزية في الاستدلال على النتائج المبينة؟
    2- مصطلح (ما عنده سنج يوزن بيها) يبين تلميحاً بأن هناك معايير لتقييم أعراض اللغات الطبيعية، فهل حدثتنا عن هذه المعايير أو "السنج" مع توضيح كيفية تطبيقها؟
                  

09-02-2015, 04:05 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: اللغة الانجليزية حسب تعريفك لديها اكثر من طبقة .. فتلك الموجودة في انجلترا تختلف عن مثيلاتها في بعض الدول الناطقة بالانجليزية .. وكما توجد لغة عربية قديمة كذلك توجد انجليزية قديمة ومكتوبا بها اعظم الروايات مما استدعي ترجمتها للغة انجليزية فصيحة حديثة ان جاز التعبير

    في الحقيقة الكلام عن اللغة العربية
    مرحباً مرة أخرى أستاذ عبد الحفيظ وشكراً للمداخلة المشجعة.
    في الحقيقة مسألة تعدد الطبقات تعنى أكثر بالمعاصرة، بمعنى أن يكون للغة أكثر من مستوى تستخدم كلها في ذات الوقت.
    أقصد بالمعاصرة أن الطبقات الثلاث تستخدم في نفس الوقت دون الانتقال الفجائي أو الاضطرار للإعلان عن ذلك، أنا اكتب حالياً بالفصحى، لكن يمكن أن أضيف ودون أن أشعر سطور بالعامية ثم اقتباسات من الشعر أو النصوص الدينية والتراثية.
    وبالتأكيد، معظم اللغات مرت بدرجات متفاوتة من التغيير، لكن انتشار اللغة العربية في مساحات واسعة والحمولة الدينية فيها من أكبر عوامل تعدد الطبقات فيها، بخلاف الإنجليزية، انفصال الدين عنها جعل اللغة الكلاسيكية فيها محصورة لاستخدامات معينة، فهذه لا تصنف على أنها طبقة.
    ما سردته في المقتبس أعلاه يسمى (لهجة) في الحقيقة. فما المعني بثلاثية الطبقات (triglossia)؟



    أواصل لاحقاً بتفصيل أوفى
    الصورة أعلاه واخريات متوفرة في عرض تقديمي بالإنجليزية (باوربوينت) في موقع كلماسوفت هنا

    http://kalmasoft.com/papers/PE-11-MT01.zip


    الملف مضغوط

    (عدل بواسطة حاتم إبراهيم on 11-29-2015, 04:39 PM)

                  

09-02-2015, 04:12 PM

Abureesh
<aAbureesh
تاريخ التسجيل: 09-22-2003
مجموع المشاركات: 30182

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    يا حاتم باللاى لوك الصبر..

    هناك فرق بين ان تكتب رأيك بصورة عامة فى منبر عام للنقاش وبين ان تكتب بصورة مفصلـة.. كم من الزمن أخذت فى تكوين هذه الاراء؟ وتيب!
                  

09-02-2015, 04:23 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: هناك فرق بين ان تكتب رأيك بصورة عامة فى منبر عام للنقاش وبين ان تكتب بصورة مفصلـة.. كم من الزمن أخذت فى تكوين هذه الاراء

    في الواقع سألت نفسي: كيف تسنى لك أن تقول ما قلت؟
    سؤالك في الحقيقة أنت أنسب من يرد عليه، أنا متخصص وأعرف ما أقول ومتى.
    المحير في الأمر أن تكتب فقرة في عجالة في خمس دقائق (بدون تفكير) ثم يتطلب الأمر أكثر من عام حتى تحاول تفسير فقرتك
    ، ناهيك عن الدفاع عن ما جاء فيها.
    هذا لا يترك غير استفهام آخر، فيم كنت تفكر عندما قررت أن تكتب هذه المداخلة، مجرد معاكسة؟
    يستحسن أن تأخذ بموجهاتي، مجرد نصيحة
    الرد على فقرتك لن يكلف سوى عشرة دقائق إن كنت تعني ما فيها.
                  

09-02-2015, 04:41 PM

Abureesh
<aAbureesh
تاريخ التسجيل: 09-22-2003
مجموع المشاركات: 30182

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    طيب يا حاتم،

    تصبيـرة لحدى ما ارجع للموضوع الأصلى، (موش مداخلتى التى بنيتها عليه)

    "أنا خارج الشبكة لأن الحاسوب ما شغال.. وضاع منى رقم الهاتف لمهندس الدعم الفنى.. والان استعمل الموبايل لتصفح الشبكة العنكبوتيـة"

    بالله عليك ورينا لو سبويـه قرأ الالكلام الفوق دا حيطلع بشنو أو حيفهم شنو؟
                  

09-02-2015, 05:44 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: بالله عليك ورينا لو سبويـه قرأ الالكلام الفوق دا حيطلع بشنو أو حيفهم شنو؟

    عيب عليك يا باشمهندس

    "أنا لا اضغط لنكات أو أبرح موقعي هذا"
    "شكرا للرابط وكع ذلك أقول انه مضى عليه وقت طويل واقترح عليك فتح بوست جديد"
    "sorry I am not on the Arabic computer"
    " بس اليومين دى مشغول مع الأخذ فى ال‘تبار ان ما طرحته من اسئلة يحتاج الى روية فى الكتابة وجهد فى إيضاح الرأى"
    "يا حاتم باللاى لوك الصبر.. "
    "أنا خارج الشبكة لأن الحاسوب ما شغال.. وضاع منى رقم الهاتف لمهندس الدعم الفنى"

    آمل أن تراجع "التصبيرات" أعلاه أيضاً
    -------------------

    المطلوب ترجمة فكرتك عن الفقرة التي كتبتها وليس معاني كلماتها يا باشمهندس
    هل تصعب عليك كلماتك؟
                  

09-02-2015, 06:08 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: بالله عليك ورينا لو سبويـه قرأ الالكلام الفوق دا حيطلع بشنو أو حيفهم شنو؟

    عيب عليك يا باشمهندس

    - "أنا لا اضغط لنكات أو أبرح موقعي هذا"
    - "شكرا للرابط وكع ذلك أقول انه مضى عليه وقت طويل واقترح عليك فتح بوست جديد"
    - "sorry I am not on the Arabic computer"
    - " بس اليومين دى مشغول مع الأخذ فى ال‘تبار ان ما طرحته من اسئلة يحتاج الى روية فى الكتابة وجهد فى إيضاح الرأى"
    - "يا حاتم باللاى لوك الصبر.. "
    - "أنا خارج الشبكة لأن الحاسوب ما شغال.. وضاع منى رقم الهاتف لمهندس الدعم الفنى"

    آمل أن تراجع "التصبيرات" الفوق دي!
    -------------------

    المطلوب ترجمة فكرتك عن الفقرة التي كتبتها وليس معاني كلماتها يا باشمهندس
    هل تصعب عليك كلماتك؟
                  

09-02-2015, 06:25 PM

Abureesh
<aAbureesh
تاريخ التسجيل: 09-22-2003
مجموع المشاركات: 30182

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: - "أنا لا اضغط لنكات أو أبرح موقعي هذا"


    اللنكات وين يا حاتم.. قول بسم الله.. أنا كتبت جملة باللغة العربية وسألتك عن أى فهم يمكن ان يخرج به سيبويه .


    Quote: تصبيـرة لحدى ما ارجع للموضوع الأصلى، (موش مداخلتى التى بنيتها عليه)
    "أنا خارج الشبكة لأن الحاسوب ما شغال.. وضاع منى رقم الهاتف لمهندس الدعم الفنى.. والان استعمل الموبايل لتصفح الشبكة العنكبوتيـة"
    بالله عليك ورينا لو سبويـه قرأ الالكلام الفوق دا حيطلع بشنو أو حيفهم شنو؟


    الكلام الفوق هو الجملة باللغة العربية الحديثة التى تبدأ "أنا خارج الشبكـة" لذلك وضعتها بين قوسين

    (عدل بواسطة Abureesh on 09-02-2015, 06:28 PM)

                  

09-02-2015, 06:43 PM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: اللنكات وين يا حاتم.. قول بسم الله

    بسم الله، قلنا نذكرك الحيل القديمة بتاعتك، عشان تشوف غيرها
    على أية حال
    الموضوع دا بيهمني جداً، وفيهو كلام كتير
    وباين عليك ما جاهز كالعادة
    بس ياريت تديني ميعاد محدد لجهوزيتك

    عشان المداخلات تكون منظمة.
    _____
    بالمناسبة:
    دا ما (وجهة نظر) أو (رأي)
    دا مشروع بحثي تطبيقي يا باشمهندس وفي مرحلة التجريب.
    يعني لما تم وضعه هنا قبل سنة، كانت بقية البحث في طور الإخراج والبرامج في التجريب.
                  

11-23-2015, 09:20 AM

حاتم إبراهيم
<aحاتم إبراهيم
تاريخ التسجيل: 08-11-2014
مجموع المشاركات: 3382

للتواصل معنا

FaceBook
تويتر Twitter
YouTube

20 عاما من العطاء و الصمود
مكتبة سودانيزاونلاين
Re: تحليل اللغة العربية بالكمبيوتر، الجزء ال� (Re: حاتم إبراهيم)

    Quote: If you ever tried to enter equations into a word document in Arabic, you will definitely agree that the biggest idiocy in the history of mankind is the attempt to use the Arabic language in computers, or to that matter in any technical/scientific field (from Astronomy to Civil Engineering and between). What do Arabs need Computers for؟ Nancy Ajram and soccer can both be reached using English letters. And as for contributing to humanity: the world doesn't need Arabs discussions about honor crimes and length of ones beard
    Hi Elrasheed
    Well, IMHO it is the other way around, i.e. who cares about processing Arabic؟To my knowledge the best answer should come from language consumers, regardless of how they use it and in what ways others view it. Thanks.

    (عدل بواسطة حاتم إبراهيم on 11-23-2015, 03:59 PM)

                  


[رد على الموضوع] صفحة 1 „‰ 1:   <<  1  >>




احدث عناوين سودانيز اون لاين الان
اراء حرة و مقالات
Latest Posts in English Forum
Articles and Views
اخر المواضيع فى المنبر العام
News and Press Releases
اخبار و بيانات



فيس بوك تويتر انستقرام يوتيوب بنتيريست
الرسائل والمقالات و الآراء المنشورة في المنتدى بأسماء أصحابها أو بأسماء مستعارة لا تمثل بالضرورة الرأي الرسمي لصاحب الموقع أو سودانيز اون لاين بل تمثل وجهة نظر كاتبها
لا يمكنك نقل أو اقتباس اى مواد أعلامية من هذا الموقع الا بعد الحصول على اذن من الادارة
About Us
Contact Us
About Sudanese Online
اخبار و بيانات
اراء حرة و مقالات
صور سودانيزاونلاين
فيديوهات سودانيزاونلاين
ويكيبيديا سودانيز اون لاين
منتديات سودانيزاونلاين
News and Press Releases
Articles and Views
SudaneseOnline Images
Sudanese Online Videos
Sudanese Online Wikipedia
Sudanese Online Forums
If you're looking to submit News,Video,a Press Release or or Article please feel free to send it to [email protected]

© 2014 SudaneseOnline.com

Software Version 1.3.0 © 2N-com.de