في الأسبوع الماضي ، باحثو مايكروسوفت إعلان إطار تجريبي للتحكم في الروبوتات والطائرات بدون طيار باستخدام القدرات اللغوية لـ ChatGPT ، وهو نموذج لغة AI شائع تم إنشاؤه بواسطة OpenAI. باستخدام أوامر اللغة الطبيعية ، يمكن لـ ChatGPT كتابة رمز خاص يتحكم في حركات الروبوت. ثم يرى الإنسان النتائج ويضبط حسب الضرورة حتى تكتمل المهمة بنجاح.
وصل البحث في مقال بعنوان “ChatGPT للروبوتات: مبادئ التصميم وقدرات النموذج“، بقلم Sai Vemprala و Rogerio Bonatti و Arthur Bucker و Ashish Kapoor من Microsoft Autonomous Systems and Robotics Group.
في فيديو تجريبيتعرض Microsoft الروبوتات – التي يتحكم فيها على ما يبدو برمز مكتوب بواسطة ChatGPT أثناء اتباع التعليمات البشرية – باستخدام ذراع روبوت لتنظيم الكتل في شعار Microsoft ، أو قيادة طائرة بدون طيار لفحص محتويات الرف أو العثور على أشياء لاستخدام روبوت بقدرات رؤية.
لجعل واجهة ChatGPT مع الروبوتات ، قام الباحثون بتعليم ChatGPT واجهة برمجة تطبيقات مخصصة للروبوتات. عند إعطاء تعليمات مثل “التقاط الكرة” ، يمكن لـ ChatGPT إنشاء رمز تحكم آلي كما لو كان يكتب قصيدة أو يكمل مقالًا. بعد أن يقوم الإنسان بفحص وتعديل الكود للتحقق من دقته وأمانه ، يمكن للمشغل البشري أداء المهمة وتقييم أدائها.
بهذه الطريقة ، يقوم ChatGPT بتسريع برمجة الأوامر الروبوتية ، لكنه ليس نظامًا قائمًا بذاته. تقول المقالة “نؤكد أن استخدام ChatGPT للروبوتات ليس عملية مؤتمتة بالكامل ، بل تعمل كأداة لتعزيز القدرات البشرية.”
على الرغم من أنه يبدو أن معظم التعليقات على ChatGPT (من حيث نجاح أو فشل أفعالها) تأتي من البشر في شكل نصي ، يزعم الباحثون أيضًا أنهم حققوا بعض النجاح في إدخال البيانات المرئية إلى ChatGPT نفسه. في أحد الأمثلة ، أوعز الباحثون إلى ChatGPT بأن يأمر روبوتًا بإمساك كرة سلة بتغذية مرتدة من الكاميرا: “يمكن لـ ChatGPT تقدير مظهر الكرة والسماء في صورة الكاميرا باستخدام كود SVG. يثير هذا السلوك احتمال أن LLM تتبع نمط عالم ضمني يتجاوز الاحتمالات المستندة إلى النص. “
على الرغم من أن النتائج تبدو بدائية في الوقت الحالي ، إلا أنها تمثل المحاولات الأولى لتطبيق أحدث التقنيات في الوقت الحالي – نماذج اللغة الكبيرة – للتحكم الآلي. وفقًا لمايكروسوفت ، يمكن لواجهة ChatGPT أن تفتح الروبوتات لجمهور أوسع بكثير في المستقبل.
يقرأ Microsoft Research “هدفنا من هذا البحث هو معرفة ما إذا كان بإمكان ChatGPT التفكير فيما وراء النص والعقل حول العالم المادي للمساعدة في المهام الآلية”. مشاركة مدونة. “نريد مساعدة الناس على التفاعل بسهولة أكبر مع الروبوتات ، دون الحاجة إلى تعلم لغات البرمجة المعقدة أو تفاصيل حول الأنظمة الروبوتية.”