يوم الأربعاء ، قدمت جوجل النخيل 2، مجموعة من نماذج اللغة الأساسية التي يمكن مقارنتها بـ OpenAI’s GPT-4. في حدث Google I / O في ماونتن فيو بولاية كاليفورنيا ، كشفت Google أنها كانت تستخدم بالفعل PaLM 2 لتشغيل 25 منتجًا ، بما في ذلك مساعد الذكاء الاصطناعي للمحادثة Bard.
كعائلة من نماذج اللغات الكبيرة (LLM) ، تم تدريب PaLM 2 على حجم ضخم من البيانات ويقوم بإجراء تنبؤ بالكلمة التالية ، والذي ينتج النص الأكثر احتمالية بعد الإدخال البشري السريع. يرمز PaLM إلى “نموذج لغة المسارات” و “رحلة“هي إحدى تقنيات التعلم الآلي التي تم إنشاؤها في Google. يعتبر PaLM 2 بمثابة متابعة لـ الأصلي النخيلالتي أعلنت عنها Google في أبريل 2022.
وفقًا لـ Google ، يدعم PaLM 2 أكثر من 100 لغة ويمكنه أداء “التفكير المنطقي” وإنشاء الكود والترجمة متعددة اللغات. خلال كلمته الرئيسية في مؤتمر Google I / O 2023 ، قال سوندار بيتشاي ، الرئيس التنفيذي لشركة Google ، إن PaLM 2 متاح بأربعة أحجام: Gecko و Otter و Bison و Unicorn. أبو بريص هو الأصغر ويمكن تشغيله على جهاز محمول. إلى جانب Bard ، يعد PaLM 2 هو المنشئ لوظائف الذكاء الاصطناعي في المستندات وجداول البيانات والعروض التقديمية.
كل شيء رائع ، ولكن كيف يقارن PaLM 2 بـ GPT-4؟ في ال تقرير PALM 2 الفنيالنخيل 2 يبدو للتغلب على GPT-4 في بعض مهام الرياضيات والترجمة والاستدلال. لكن الواقع قد لا يتطابق مع معايير Google. في تقييم سريع لإصدار Bard’s PaLM 2 من قبل إيثان مولليك ، أستاذ وارتون والذي غالبًا ما يكتب عن الذكاء الاصطناعي ، وجد Mollick أن أداء PaLM 2 يبدو أسوأ من GPT-4 و Bing في العديد من اختبارات اللغة غير الرسمية ، مفصلة في موضوع Twitter.
حتى وقت قريب ، كانت عائلة نماذج اللغات PaLM منتجًا داخليًا لأبحاث Google بدون تعرض المستهلك ، لكن Google بدأت تقديم وصول محدود إلى API في مارس. ومع ذلك ، تميز أول PaLM بحجمه الهائل: 540 مليار معلمة. المعلمات هي متغيرات رقمية تعمل بمثابة “المعرفة” المكتسبة للنموذج ، مما يسمح له بعمل تنبؤات وإنشاء نص بناءً على المدخلات التي يتلقاها.
يعني المزيد من المعلمات إلى حد كبير مزيدًا من التعقيد ، ولكن ليس هناك ما يضمن استخدامها بفعالية. بالمقارنة ، تحتوي GPT-3 الخاصة بـ OpenAI (اعتبارًا من 2020) على 175 مليار معلمة. لم تكشف OpenAI مطلقًا عن عدد المعلمات في GPT-4.
هذا يقودنا إلى السؤال الكبير: ما مدى “حجم” PaLM 2 من حيث عدد المعلمات؟ جوجل لا تقلمما أحبط البعض المتخصصين في الصناعة الذين غالبًا ما يناضلون من أجل مزيد من الشفافية فيما يجعل نماذج الذكاء الاصطناعي تعمل.
هذه ليست الخاصية الوحيدة في PaLM 2 التي التزمت Google الصمت بشأنها. مقاولة قال أن PaLM 2 قد تم تدريبه على “مجموعة متنوعة من المصادر: مستندات الويب ، والكتب ، والرموز ، والرياضيات ، وبيانات المحادثة” ، ولكنه لا يخوض في التفاصيل حول ماهية تلك البيانات بالضبط.
كما هو الحال مع مجموعات بيانات نموذج اللغة الكبيرة الأخرى ، من المحتمل أن تتضمن مجموعة بيانات PaLM 2 مجموعة متنوعة من المواد المحمية بحقوق النشر تستخدم بدون تصريح والمواد التي يحتمل أن تكون خطرة خدش من الإنترنت. تؤثر بيانات التدريب بشكل حاسم على مخرجات أي نموذج ذكاء اصطناعي ، لذلك دعا بعض الخبراء إلى استخدام مجموعات البيانات المفتوحة والتي قد توفر فرصًا للتكاثر العلمي والمراجعة الأخلاقية.
“الآن بعد أن أصبحت LLM منتجات (وليست مجرد بحث) ، فإننا في نقطة تحول: ستصبح الشركات الهادفة للربح أقل شفافية * على وجه التحديد * حول المكونات الأكثر أهمية ،” غرد جيسي دودج ، عالم أبحاث في معهد ألين للذكاء الاصطناعي. “فقط إذا تمكن مجتمع المصادر المفتوحة من التنظيم معًا ، يمكننا مواكبة ذلك!”
حتى الآن ، لم يمنع انتقاد إخفاء الصلصة السرية Google من متابعة نشر واسع لنماذج الذكاء الاصطناعي ، على الرغم من الاتجاه عبر جميع LLMs لاختراع الأشياء ببساطة من الصفر. خلال مؤتمر Google I / O ، أظهر ممثلو الشركة ميزات الذكاء الاصطناعي في العديد من منتجاتها الرئيسية ، مما يعني أن قطاعات كبيرة من الجمهور قد تكافح قريبًا صراعات Google. AI.
وعندما يتعلق الأمر بـ LLMs ، فإن PaLM 2 بعيدة كل البعد عن نهاية القصة: في الكلمة الرئيسية I / O ، ذكر بيتشاي أن نموذجًا جديدًا للذكاء الاصطناعي متعدد الوسائط يسمى “الجوزاء” قيد التدريب حاليًا. مع استمرار السباق على هيمنة الذكاء الاصطناعي ، يستخدم مستخدمو Google في الولايات المتحدة و 180 دولة أخرى (الغريب باستثناء كندا وأوروبا القارية) يمكن جرب PaLM 2 بأنفسهم كجزء من Google Bard ، مساعد الذكاء الاصطناعي التجريبي.