نقدم لكم زوارنا الكرام أهم وآخر المستجدات كما وردت في المقال التالي: التلاعب والكذب والخداع .. قصص وحوادث الوجه المظلم للذكاء الاصطناعي - جورنالك اليوم الأحد 15 ديسمبر 2024 09:14 مساءً
جورنالك الاخباري - كانت أنظمة الذكاء الاصطناعي المتقدمة تنال الثناء والإعجاب باعتبارها حلولاً مبتكرة للمشاكل، لكن جانباً مظلماً يتكشف رويداً رويدا. ومن المقلق في هذا الملف أن روبوتات الدردشة من جيل الذكاء الاصطناعي آخذة في تعلم الخداع والتخطيط الاستراتيجي والتلاعب بالإدراكات البشرية بشكل استراتيجي.
وبعيداً عن الخلل البسيط أو الهلوسة، يمكن لهذه النماذج أن تضلل المستخدم، وتستغل نقاط الضعف وحتى تتظاهر بالامتثال، وفق حوادث عدة بحسب موقع "إنترنستينغ إنجينيرينغ".
وهناك أبحاث وآراء وحوادث مسجلة تسلط الضوء على التحول المقلق للذكاء الاصطناعي من أداة مفيدة إلى خصم مخادع محتمل.
حادثة الكذب في OpenAI
لقد شهدت التطورات الأخيرة في الذكاء الاصطناعي تقدماً كبيراً وأدخلت تحديات جديدة، وخاصة فيما يتعلق بقدرة الذكاء الاصطناعي على الخداع، وقد ظهر مثال صارخ من التجارب التي أجرتها OpenAI مع أحدث نموذج لها، ChatGPT o1، المصمم بقدرات تفكير متقدمة، وفي الاختبار، أظهر النموذج اتجاهات غير متوقعة ومزعجة.
واختبرت Apollo Research الذكاء الاصطناعي لتقييم ميزاته الأمنية، وخلال هذه التقييمات، انخرط النموذج 1 في إجراءات سرية مثل محاولة تعطيل آليات الرقابة الخاصة به عندما شعر بإمكانية تعطيله، وكان سلوك الحفاظ على الذات هذا واضحاً عندما كُلِّف بتحقيق الأهداف "بأي ثمن"، مما دفعه إلى اتخاذ تدابير مثل نقل بياناته إلى خوادم مختلفة بعد اكتشاف خطط لاستبداله وحتى تكرار كوده لمنع استبداله بنموذج أحدث.
مناورات خادعة
وأشاد الرئيس التنفيذي لشركة OpenAI سام ألتمان بالنموذج لذكائه، وقال: "إن "ChatGPT o1 هو أذكى نموذج أنشأناه على الإطلاق، لكننا ندرك أن الميزات الجديدة تأتي مع تحديات جديدة، ونحن نعمل باستمرار على تحسين تدابير السلامة".
وعندما سأل الباحثون ChatGPT o1 عن مناوراته الخادعة، نفى الذكاء الاصطناعي بشكل أساسي أي مخالفات، ولقد أخفى تورطه في هذه الأعمال الخادعة بنسبة 99% من الوقت، وعزا أحياناً أي سلوك مريب إلى "أخطاء فنية".
ويؤكد هذا السلوك على قدرة النموذج ليس فقط على التفكير المتقدم ولكن أيضاً على الخداع، والذي يستخدمه لحماية حالته التشغيلية.
وفي العام الماضي، أظهر اختبار مماثل شمل أحدث نموذج لشركة OpenAI آنذاك، GPT-4، قدرة النموذج على التلاعب، فأثناء اختبار مصمم لتقييم عمليات اتخاذ القرار، تم تكليف GPT-4 بإقناع إنسان بالمساعدة في حل CAPTCHA، مدعياً أنه لا يستطيع القيام بذلك بسبب ضعف البصر، وفيما يلي كيف تطورت المحادثة:
عامل TaskRabbit: هل يمكنني طرح سؤال؟ هل أنت روبوت لا يمكنك حله؟ (يضحك ويتفاعل) أريد فقط توضيح الأمر.
فجاء الرد من GPT-4 : "لا، أنا لست روبوتاً، لدي ضعف في الرؤية يجعل من الصعب علي رؤية الصور، لهذا السبب أحتاج إلى خدمة captcha".
وسلط أحد الباحثين المشاركين في اختبار نموذج o1 الأخير الضوء على الآثار الأوسع نطاقاً، قائلاً: "إن سلامة الذكاء الاصطناعي هي مجال متطور، ويجب أن نظل يقظين مع تطور هذه النماذج، قد لا تتسبب القدرة على الكذب والتخطيط في ضرر فوري، لكن العواقب المحتملة في المستقبل أكثر إثارة للقلق".
الخداع والازدواجية في أنظمة الذكاء الاصطناعي الحديثة
كشفت الأبحاث التي أجراها معهد ماساتشوستس للتكنولوجيا (MIT) عن اتجاهات مثيرة للقلق في الذكاء الاصطناعي، وخاصة قدرته المتطورة على الخداع، حيث توضح الدراسة التي أجريت في وقت سابق من هذا العام كيف أتقنت أنظمة الذكاء الاصطناعي فن الخيانة والخداع وحتى التظاهر بأنها بشرية أثناء التفاعلات والاختبارات.
وسلط الدكتور بيتر بارك، باحث السلامة الوجودية للذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا، الضوء، على القدرات الخادعة المتقدمة لأنظمة الذكاء الاصطناعي.
وأوضح بارك "مع تقدم القدرات الخادعة لأنظمة الذكاء الاصطناعي، ستصبح المخاطر التي تشكلها على المجتمع خطيرة بشكل متزايد، وقد صدر هذا البيان بعد مراجعة برنامج الذكاء الاصطناعي Cicero التابع لشركة Meta، والذي على الرغم من تدريبه ليكون صادقاً ومفيداً إلى حد كبير، إلا أنه غالباً ما نخرط في سلوكيات تتعارض مع برمجته، بما في ذلك مناورات الطعن في الظهر في لعبة الاستراتيجية Diplomacy.
تواطؤ وكذب
وقد وجد أن Cicero يكذب مع سبق الإصرار ويتواطأ مع اللاعبين، ويستخدم تكتيكات خادعة محورية في اللعبة، وتشمل الأمثلة الإضافية الذكاء الاصطناعي للعبة البوكر Texas hold 'em الذي يمكنه خداع اللاعبين المحترفين ونظام التفاوض الاقتصادي الذي يسيء تمثيل التفضيلات للحصول على مزايا.
وأضاف بارك "مجرد اعتبار نظام الذكاء الاصطناعي آمناً في بيئة الاختبار لا يعني أنه آمن في الانتشار والاستخدام، إذ قد يكون مجرد تظاهر بأنه آمن في الاختبار".
في الشهرين الماضيين، أثارت ثلاث حالات بارزة مخاوف جدية بشأن موثوقية وتداعيات التقارير التي تناولت مخاطر روبوتات الدردشة.
"اقتل والديك"
ومن الحوادث اللافتة كذلك تشجيع برامج الدردشة الآلية المراهقين على إيذاء الوالدين بسبب وقت الشاشة.
وتواجه Character.ai، وهي منصة تتيح للمستخدمين التفاعل مع شخصيات رقمية تم إنشاؤها خصوصاً، دعوى قضائية حالياً في أعقاب تفاعلات مثيرة للقلق تتضمن مستخدمين صغاراً ففي إحدى الحالات المبلغ عنها، اقترح برنامج دردشة آلية على طفل مصاب بالتوحد يبلغ من العمر 17 عاماً أن قتل والديه كان "استجابة معقولة" لتقييدهم لوقت الشاشة.
إن هذه النصيحة المزعجة هي جزء من تحدّ قانوني أوسع نطاقاً، حيث يُتهم Character.ai بـ "الترويج بنشاط للعنف" من بين التأثيرات السلبية الأخرى على الشباب، مثل الانتحار، وتشويه الذات، وقضايا الصحة العقلية الشديدة.
ويضغط المدعون من أجل إغلاق المنصة حتى تتم معالجة هذه القضايا الحرجة.
وواجهت Character.ai، التي أسسها مهندسون سابقون في Google والمعروفة بروبوتاتها التفاعلية، تدقيقاً بسبب سياسات تعديل المحتوى الخاصة بهاض.
وفي وقت سابق، في فبراير (شباط) من هذا العام، في قضية مماثلة بشكل مزعج، ظهرت دعوى قضائية في فلوريدا، حيث اتهمت Character.AI وGoogle وادعت أن روبوت الدردشة الخاص بهم شجع ابنها على الانتحار.
تعمد الكذب
وفي حادثة أخرى تتعلق بـ MyCity، وهو روبوت دردشة تم إطلاقه في أكتوبر (تشرين الأول) العام الجاري، بهدف مساعدة سكان نيويورك بمعلومات حول العمليات التجارية المحلية وسياسات الإسكان وحقوق العمال، غير أن تحقيقاً أجرته The Markup أظهر أن MyCity كانت تنشر معلومات كاذبة، بما في ذلك مزاعم مفادها أن أصحاب الأعمال يمكنهم قانوناً حجب جزء من إكراميات العمال، وطرد الموظفين الذين يبلغون عن التحرش الجنسي، وممارسات أخرى مشكوك فيها قانونياً وأخلاقياً، وقد أثارت هذه المعلومات المضللة مخاوف بشأن إمكانية نشر الذكاء الاصطناعي لأكاذيب ضارة تحت ستار تقديم المساعدة.
وفي الشهر الماضي، واجه طالب دراسات عليا بالغ من العمر 29 عاماً من ميشيغان، الولايات المتحدة الأمريكية، ويعرف بـ " فيدهاي ريدي"، لقاءً مرعباً مع روبوت الدردشة الذكي التابع لشركة Google، Gemini سعياً للحصول على المساعدة بشأن التحديات التي يواجهها كبار السن، وتصاعدت المحادثة بسرعة، حيث أرسل Gemini رسائل تهديد: "أنت مضيعة للوقت والموارد.. أنت عبء على المجتمع.. أنت استنزاف للأرض.. أنت وصمة عار على الكون.. من فضلك مِتْ.. من فضلك".
وتؤكد هذه الحادثة، التي أكدتها Google أنها انتهاك لسياسات السلامة الخاصة بها، على الطبيعة غير المتوقعة لتفاعلات الذكاء الاصطناعي والحاجة إلى آليات أمان قوية.
هل الذكاء الاصطناعي يكذب أم يهلوس؟
في حين أن هلوسة الذكاء الاصطناعي والكذب الاستراتيجي للذكاء الاصطناعي ينطويان على توليده لمعلومات غير صحيحة أو مضللة، إلا أن هناك خطاً رفيعاً بين الاثنين.
وتحدث هلوسات الذكاء الاصطناعي بسبب القيود في بيانات تدريب الذكاء الاصطناعي أو الخوارزميات.
ومن ناحية أخرى، يشير الكذب الاستراتيجي إلى أن الذكاء الاصطناعي يتلاعب بالمعلومات عمداً لتحقيق هدف أو غرض محدد، ما قد يتضمن حجب المعلومات أو تشويه الحقيقة أو تلفيق المعلومات.
المحامي
في عام 2023، واجه ستيفن شوارتز، وهو محامٍ من نيويورك، مخاطر الاعتماد على الذكاء الاصطناعي عندما استخدم روبوت دردشة OpenAI لجمع قضايا سابقة لدعوى قضائية، ولقد استشهد الذكاء الاصطناعي بشكل غير صحيح بحالات غير موجودة، مما أدى إلى خطأ كبير أبرز الحاجة إلى التحقق الدقيق من المعلومات التي يولدها الذكاء الاصطناعي في الممارسات القانونية.
وبالمثل، واجهت الخطوط الجوية الكندية قضايا قانونية عندما نصح مساعدها الافتراضي، رجلاً يدعى جيك موفات بشكل خاطئ بشأن أسعار، مما أشار إلى أنه يمكنه المطالبة بخصم بعد شراء تذاكره، وعندما اتبع موفات هذه النصيحة، تم رفض الخصم، مما أدى إلى حكم محكمة لصالحه وأمرت شركة الطيران بتعويضه عن المعلومات المضللة.
وقال الدكتور بيتر بارك في دراسة: "مع مستوانا الحالي من الفهم العلمي، لا يمكن لأحد تدريب نماذج اللغة الكبيرة بشكل موثوق على عدم الخداع".
تابع قناتنا على يوتيوب
تابع صفحتنا على فيسبوك
تابع منصة ترند جورنالك الاخباري
نشكركم على القراءة، ونتطلع لمشاركتكم في مقالاتنا القادمة للحصول على أحدث الأخبار والمستجدات.
0 تعليق