كشف مركز الأبحاث الحديث في أبوظبي عن أكبر نموذج لمعالجة اللغة العربية في العالم.
تعد معالجة اللغة الطبيعية ، أو NPL ، جزءًا مهمًا من قطاع الذكاء الاصطناعي سريع النمو ، حيث تقود تطوير كل شيء بدءًا من أدوات ترجمة اللغة إلى أجهزة الكمبيوتر إلى المساعد الذكي على غرار Siri و Alexa لتحويل الكلمات المنطوقة والمكتوبة. تساعد في فك التشفير.
يمكن لنموذج نور ، الذي تم تطويره في معهد الابتكار التكنولوجي ، أن يمنح العالم العربي انخفاضًا حادًا في الأسواق الناطقة باللغة الإنجليزية والصينية للرقمنة في شكل أدوات مثل روبوتات المحادثة وذكاء السوق والترجمة الآلية.
قال الدكتور أبتسام المزروعي ، مدير TII الذي قاد المشروع ، إن الأولوية هي لاستخدام نور من قبل الشركات والأوساط الأكاديمية لإنشاء أدوات جديدة ، مثل توفير تحليل المشاعر على وسائل التواصل الاجتماعي ، أو لتطوير مساعدين افتراضيين عربيين جدد. وطنيو
لكنه أضاف أن نسخة أصغر من نور ستتاح أيضًا للجمهور كنموذج مفتوح المصدر.
“نحن نحب [Noor] للمساهمة في المجتمع.
حجم النور مهم. في البرمجة اللغوية العصبية ، يعتمد حجم نموذج معين على عدد القيم التي يتم تدريب النموذج عليها. تُعرف هذه القيم بالمعلمات ، وهي اللبنات الأساسية للتعلم الآلي. كلما زاد عدد المعلمات ، كان نموذج البرمجة اللغوية العصبية أكثر تعقيدًا وفعالية.
قبل ذلك ، كان أكبر نموذج عربي متاح هو AraGPT ، وهو نموذج تم تدريبه على 1.5 مليار معلمة. تم تدريب نور على 10 مليارات معلمة ، بما في ذلك مجموعة البيانات التي تجمع بين بيانات الويب والكتب والشعر والمقالات الإخبارية والمعلومات التقنية لتوسيع التطبيقات التي يمكن بناؤها بشكل كبير.
وفقًا لـ TII ، تعد هذه أكبر مجموعة بيانات عربية عبر النطاقات عالية الجودة حتى الآن.
قال الدكتور المزاروي: “على مقياس 10 مليارات ، يمكن لنموذجنا معالجة مهام أكثر تقدمًا وتحمل تعليمات أكثر تعقيدًا من البشر إلى الآلات”.
“على سبيل المثال ، يمكنه تلخيص النصوص ، والمساعدة في الكتابة – على سبيل المثال ، بيان صحفي. بالإضافة إلى أنه يمكن استخدامه لتشغيل روبوتات محادثة أكثر طبيعية وفعالية ، أو يمكن القيام بذلك أيضًا لتقييم مستوى اللغة للموظفين. هذا هي مجرد البداية ، ونريد بناء نماذج أكبر وأكثر قدرة في المستقبل. “
يُعد TII ، ذراع الأبحاث التطبيقية لمجلس أبحاث التكنولوجيا المتقدمة في أبوظبي ، جزءًا مهمًا من جهود دولة الإمارات العربية المتحدة للتنويع من الاعتماد على صادرات النفط وتطوير اقتصاد قائم على المعرفة. هذه المبادرة هي الخطوة الأولى في جهود مركز أبحاث نور للمساهمة في استراتيجية الإمارات العربية المتحدة الأوسع للذكاء الاصطناعي من خلال تسريع تبني ودمج الذكاء الاصطناعي في الاقتصاد الأوسع.
قال الدكتور راي جونسون ، الرئيس التنفيذي لمعهد الاستثمار الدولي ، “أثبتت فرق الخبراء لدينا مرة أخرى أن هذا القطاع يمكن أن يحقق نتائج مهمة في مجال البحث والتطوير للتأثير على العالم”.
تم التحديث في: 15 أبريل 2022 ، الساعة 3:49 صباحًا