|
Re: ***خدمات للترجمة أفضل من Google Translate*** (Re: احمد حمودى)
|
Quote: Marcin Junczys-Dowmunt Dear all, I would like to announce the official release of the United Nations Parallel Corpus v1.0. The corpus was created as part of the United Nations commitment to multilingualism and as a reaction to the growing importance of statistical machine translation (SMT) within the Department for General Assembly and Conference Management (DGACM) translation services and the United Nations. It covers 25 years, from 1990 to 2014, and contains documents in the six official languages of the United Nations: Arabic, Chinese, English, French, Russian, and Spanish.
The purpose of the corpus is to allow access to multilingual language resources and facilitate research and progress in various natural language processing tasks, including machine translation. For convenience, the corpus is also available pre-packaged as bi-texts for each language pair.
A subset of the corpus is available as a six-language fully-parallel corpus, i.e. all sentences have #####alents in all six languages. Data from 2015 has been used to created official development sets and test sets, also fully aligned across the six official UN languages. The paper reports SMT baselines for all languages pairs for this corpus. |
يعني شنو الكلام الفوق دا؟ | دا خبر وصلني قبل ساعات، باختصار، بيستخدموا جمل طويلة تمت موائمتها مع ترجماتها من لغات مختلفة، الترجمات دي اتعملت بواسطة خبراء يعملون لدى الأمم المتحدة، مجموعة الجمل دي جاءت ضمن نصوص في مواضيع مختلفة، النصوص دي ناس هندسة اللغات (الاسم الشامل لفرع معالجة اللغات الطبيعية) بيسموها مكانز أو "مدونات" (corpora).
العلاقة شنو بالموضوع؟ الترجمة الآلية بتعتمد على النصوص الموائمة دي بأسلوب إحصائي، غوغول وغيرها من الشركات بتعتمد في خدمة الترجمة على النصوص الموائمة (parallel corpus) يعني بيتم حشو الكمبيوتر بكل النصوص المطلوبة لزوج اللغة المستهدف، في حالتنا (عربي-إنجليزي)، كلمة "حشو" هنا اختزال للعملية لأنها مش مجرد مطابقة للمفردات أو الجمل بل عملية تدريب على الاحتمالات الممكنة لترجمة جملة والموضوع فيهو نظريات كتيرة ما يعرف بسلاسل ماركوف (Hidden Markov Model).
أها، سمح بعد دا كلو ليه الترجمة ما صحيحة؟ لأنو نصوص الأمم المتحدة ما بالضرورة تشمل كل الكلام الاتقال في اللغة العربية بكل أصنافها والمدون في المواقع والأخبار وحديث الناس بالفصحى أو العامية، فنصوص الأمم المتحدة يمكن أن تشمل كل القرآن مثلاً ولكن ربما لم تسنح الفرصة لمترجم ليصادف الجملة (كراع البقر جيابة) وعليها يمكن قياس الكثير من تصرفات برامج الترجمة الآلية والتي هي غالباً مواقع تعمل مباشرة على النترنت لطبيعة التطوير المستمر لهذه الخدمات.
طيب إلا يستخدموا يعني نصوص رسمية من الأمم المتحدة؟ ما بالضرورة، بس كمان دي مجانية ودرجة وثوقيتها عالية باعتبار القائمين على ترجمتها خبراء، في جهات تانية عندها مكانز بس بالقروش وفي مؤسسات تانية بتجمع معلومات من المواقع متعددة اللغات، زي المواقع الإخبارية، بتعمل مطابقة للخبر بلغاته المختلفة، يعني بتلقط النسختين لنفس الخبر باللغتين المتوفرتين وبعدين تعمل قاعدة بيانات عشان يشوفوا الكلمة في اللغة الأولى قصادها شنو في اللغة التانية، شكلها صعب مش؟
أها والحكاية دي حدها وين؟ ما عندها حد، إلا الناس تتكلم بلغة قياسية أو تصبروا لحد ما العالم يقبل لغة واحدة شبه كافية لحاجات كل البشر.
ومافي حل تاني؟ في! الترجمة الآلية المعتمدة على القواعد (Rule Based Machine Translation)، يقوموا الناس يكتبوا كل القواعد الخاصة باللغة في جميع تصانيفها الإملائية والنحوية والدلالية والغرضية وبعدين يطابقوا كل قاعدة مع اختها من اللغة المستهدفة، العملية دي مطبقة في اللغات الأوروبية لأنها واضحة ولأن القائمين عليها قاموا بدري واجتهدوا، فمن فرنسي لإنجليزي مثلاً حتحصل على نتيجة شبه مكتملة والعكس صحيح ، اللغة العربية "المقدسة" لسع، عشان كدة مضطرين يغرفوها بالكوم بالطريقة الإحصائية الفوق.
ديل ناس الأمم المتحدة
http://conferences.unite.un.org/UNCorpus The United Nations Parallel Corpus v1.0 is composed of official records and other parliamentary documents of the United Nations that are in the public domain. These documents are mostly available in the six official languages of the United Nations. The current version of the corpus contains content that was produced and manually translated between 1990 and 2014, including sentence-level alignments. ____ كلو كوم وعشوائية الدلالة في اللغة العربية كوم تاني. |
|
|
|
|
|
|
|
العنوان |
الكاتب |
Date |
***خدمات للترجمة أفضل من Google Translate*** | احمد حمودى | 05-18-16, 07:51 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | احمد حمودى | 05-19-16, 05:13 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | dardiri satti | 05-21-16, 01:58 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | احمد حمودى | 05-22-16, 08:19 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | بريمة محمد | 05-23-16, 03:09 AM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | قصي محمد عبدالله | 05-23-16, 07:10 AM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | ياسر السر | 05-23-16, 08:17 AM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | حاتم إبراهيم | 05-27-16, 08:37 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | حاتم إبراهيم | 05-28-16, 06:50 AM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | حاتم إبراهيم | 05-31-16, 09:48 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | حاتم إبراهيم | 06-01-16, 12:29 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | احمد حمودى | 06-01-16, 12:41 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | صلاح حمد | 06-01-16, 01:58 PM |
Re: ***خدمات للترجمة أفضل من Google Translate*** | حاتم إبراهيم | 06-05-16, 05:22 PM |
|
|
|