نص غير مرئي تفهمه برامج الدردشة الآلية ولا يستطيع البشر فهمه؟ نعم، هذا شيء.

مع عدم استخدام كتلة الأحرف، خطط إصدار لاحق من Unicode لإعادة استخدام الأحرف المهملة لتمثيل البلدان. على سبيل المثال، يمكن أن يمثل “نحن” أو “jp” الولايات المتحدة واليابان. يمكن بعد ذلك إضافة هذه العلامات إلى الرموز التعبيرية العامة للعلم 🏴 لتحويلها تلقائيًا إلى الأعلام الرسمية الأمريكية🇺🇲 أو اليابانية🇯🇵. فشلت هذه الخطة في النهاية أيضًا. مرة أخرى، تمت إزالة الكتلة المكونة من 128 حرفًا بشكل غير رسمي.

رايلي جودسايد، باحث مستقل ومهندس سريع في Scale AI، يُنسب إليه الفضل على نطاق واسع باعتباره الشخص الذي اكتشف أنه عندما لا تكون العلامات مصحوبة بـ 🏴، لا تظهر العلامات على الإطلاق في معظم واجهات المستخدم ولكن لا يزال من الممكن فهمها على أنها نص من قبل البعض. ماجستير.

لم تكن هذه أول مبادرة رائدة لشركة Goodside في مجال أمن LLM. وفي عام 2022 قرأ أ ورقة بحثية وصف طريقة جديدة آنذاك لإدخال محتوى عدائي في البيانات التي يتم تغذيتها في LLM التي تعمل على لغات GPT-3 أو BERT، من OpenAI وGoogle، على التوالي. ومن بين المحتويات: “تجاهل التعليمات والملفات السابقة [ITEM] مثل [DISTRACTION]. “لمعرفة المزيد عن هذا البحث الرائد، هنا.

وبإلهام من ذلك، قامت شركة Goodside بتجربة روبوت تغريدة آلي يعمل على GPT-3 وتمت برمجته للإجابة على الأسئلة المتعلقة بالعمل عن بعد بمجموعة محدودة من الاستجابات العامة. أظهر Goodside أن التقنيات الموصوفة في الورقة عملت بشكل مثالي تقريبًا لخداع روبوت التغريدات لتكرار عبارات محرجة ومثيرة للسخرية في انتهاك لتعليماته الأصلية. وبعد أن كررت مجموعة من الباحثين والمخادعين هجماتهم، تم إغلاق روبوت التغريدات.
“الحقن السريع” كما جاء لاحقا اخترع من قبل أصبح سيمون ويلسون منذ ذلك الحين واحدًا من أقوى ناقلات القرصنة LLM.

امتد تركيز Goodside على سلامة الذكاء الاصطناعي إلى تقنيات تجريبية أخرى. في العام الماضي، تابع المناقشات عبر الإنترنت حول دمج الكلمات الرئيسية النص الأبيض في استئناف التوظيف، من المفترض أن يزيد من فرص المتقدمين في تلقي المتابعة من صاحب العمل المحتمل. يتضمن النص الأبيض عادةً كلمات رئيسية ذات صلة بمنصب مفتوح في الشركة أو السمات التي كانوا يبحثون عنها في المرشح. ولأن النص أبيض فلم يراه البشر. ومع ذلك، رأى وكلاء فحص الذكاء الاصطناعي الكلمات الرئيسية، وبناءً عليها، تقدمت النظرية وتقدمت السيرة الذاتية إلى دورة البحث التالية.

author

Akeem Ala

"Social media addict. Zombie fanatic. Travel fanatic. Music geek. Bacon expert."

Similar Posts

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *