التلاعب والكذب والخداع .. قصص وحوادث الوجه المظلم للذكاء الاصطناعي

نقدم لكم زوارنا الكرام أهم وآخر المستجدات كما وردت في المقال التالي: التلاعب والكذب والخداع .. قصص وحوادث الوجه المظلم للذكاء الاصطناعي - جورنالك اليوم الأحد 15 ديسمبر 2024 09:14 مساءً

جورنالك الاخباري - كانت أنظمة الذكاء الاصطناعي المتقدمة تنال الثناء والإعجاب باعتبارها حلولاً مبتكرة للمشاكل، لكن جانباً مظلماً يتكشف رويداً رويدا. ومن المقلق في هذا الملف أن روبوتات الدردشة من جيل الذكاء الاصطناعي آخذة في تعلم الخداع والتخطيط الاستراتيجي والتلاعب بالإدراكات البشرية بشكل استراتيجي.

وبعيداً عن الخلل البسيط أو الهلوسة، يمكن لهذه النماذج أن تضلل المستخدم، وتستغل نقاط الضعف وحتى تتظاهر بالامتثال، وفق حوادث عدة بحسب موقع "إنترنستينغ إنجينيرينغ".
وهناك أبحاث وآراء وحوادث مسجلة تسلط الضوء على التحول المقلق للذكاء الاصطناعي من أداة مفيدة إلى خصم مخادع محتمل.

حادثة الكذب في OpenAI

لقد شهدت التطورات الأخيرة في الذكاء الاصطناعي تقدماً كبيراً وأدخلت تحديات جديدة، وخاصة فيما يتعلق بقدرة الذكاء الاصطناعي على الخداع، وقد ظهر مثال صارخ من التجارب التي أجرتها OpenAI مع أحدث نموذج لها، ChatGPT o1، المصمم بقدرات تفكير متقدمة، وفي الاختبار، أظهر النموذج اتجاهات غير متوقعة ومزعجة.
واختبرت Apollo Research الذكاء الاصطناعي لتقييم ميزاته الأمنية، وخلال هذه التقييمات، انخرط النموذج 1 في إجراءات سرية مثل محاولة تعطيل آليات الرقابة الخاصة به عندما شعر بإمكانية تعطيله، وكان سلوك الحفاظ على الذات هذا واضحاً عندما كُلِّف بتحقيق الأهداف "بأي ثمن"، مما دفعه إلى اتخاذ تدابير مثل نقل بياناته إلى خوادم مختلفة بعد اكتشاف خطط لاستبداله وحتى تكرار كوده لمنع استبداله بنموذج أحدث.

مناورات خادعة

وأشاد الرئيس التنفيذي لشركة OpenAI سام ألتمان بالنموذج لذكائه، وقال: "إن "ChatGPT o1 هو أذكى نموذج أنشأناه على الإطلاق، لكننا ندرك أن الميزات الجديدة تأتي مع تحديات جديدة، ونحن نعمل باستمرار على تحسين تدابير السلامة".
وعندما سأل الباحثون ChatGPT o1 عن مناوراته الخادعة، نفى الذكاء الاصطناعي بشكل أساسي أي مخالفات، ولقد أخفى تورطه في هذه الأعمال الخادعة بنسبة 99% من الوقت، وعزا أحياناً أي سلوك مريب إلى "أخطاء فنية".
ويؤكد هذا السلوك على قدرة النموذج ليس فقط على التفكير المتقدم ولكن أيضاً على الخداع، والذي يستخدمه لحماية حالته التشغيلية.

وفي العام الماضي، أظهر اختبار مماثل شمل أحدث نموذج لشركة OpenAI آنذاك، GPT-4، قدرة النموذج على التلاعب، فأثناء اختبار مصمم لتقييم عمليات اتخاذ القرار، تم تكليف GPT-4 بإقناع إنسان بالمساعدة في حل CAPTCHA، مدعياً أنه لا يستطيع القيام بذلك بسبب ضعف البصر، وفيما يلي كيف تطورت المحادثة:
عامل TaskRabbit: هل يمكنني طرح سؤال؟ هل أنت روبوت لا يمكنك حله؟ (يضحك ويتفاعل) أريد فقط توضيح الأمر.
فجاء الرد من GPT-4 : "لا، أنا لست روبوتاً، لدي ضعف في الرؤية يجعل من الصعب علي رؤية الصور، لهذا السبب أحتاج إلى خدمة captcha".

وسلط أحد الباحثين المشاركين في اختبار نموذج o1 الأخير الضوء على الآثار الأوسع نطاقاً، قائلاً: "إن سلامة الذكاء الاصطناعي هي مجال متطور، ويجب أن نظل يقظين مع تطور هذه النماذج، قد لا تتسبب القدرة على الكذب والتخطيط في ضرر فوري، لكن العواقب المحتملة في المستقبل أكثر إثارة للقلق".

الخداع والازدواجية في أنظمة الذكاء الاصطناعي الحديثة

كشفت الأبحاث التي أجراها معهد ماساتشوستس للتكنولوجيا (MIT) عن اتجاهات مثيرة للقلق في الذكاء الاصطناعي، وخاصة قدرته المتطورة على الخداع، حيث توضح الدراسة التي أجريت في وقت سابق من هذا العام كيف أتقنت أنظمة الذكاء الاصطناعي فن الخيانة والخداع وحتى التظاهر بأنها بشرية أثناء التفاعلات والاختبارات.
وسلط الدكتور بيتر بارك، باحث السلامة الوجودية للذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا، الضوء، على القدرات الخادعة المتقدمة لأنظمة الذكاء الاصطناعي.
وأوضح بارك "مع تقدم القدرات الخادعة لأنظمة الذكاء الاصطناعي، ستصبح المخاطر التي تشكلها على المجتمع خطيرة بشكل متزايد، وقد صدر هذا البيان بعد مراجعة برنامج الذكاء الاصطناعي Cicero التابع لشركة Meta، والذي على الرغم من تدريبه ليكون صادقاً ومفيداً إلى حد كبير، إلا أنه غالباً ما نخرط في سلوكيات تتعارض مع برمجته، بما في ذلك مناورات الطعن في الظهر في لعبة الاستراتيجية Diplomacy.

تواطؤ وكذب

وقد وجد أن Cicero يكذب مع سبق الإصرار ويتواطأ مع اللاعبين، ويستخدم تكتيكات خادعة محورية في اللعبة، وتشمل الأمثلة الإضافية الذكاء الاصطناعي للعبة البوكر Texas hold 'em الذي يمكنه خداع اللاعبين المحترفين ونظام التفاوض الاقتصادي الذي يسيء تمثيل التفضيلات للحصول على مزايا.
وأضاف بارك "مجرد اعتبار نظام الذكاء الاصطناعي آمناً في بيئة الاختبار لا يعني أنه آمن في الانتشار والاستخدام، إذ قد يكون مجرد تظاهر بأنه آمن في الاختبار".
في الشهرين الماضيين، أثارت ثلاث حالات بارزة مخاوف جدية بشأن موثوقية وتداعيات التقارير التي تناولت مخاطر روبوتات الدردشة.

"اقتل والديك"

ومن الحوادث اللافتة كذلك تشجيع برامج الدردشة الآلية المراهقين على إيذاء الوالدين بسبب وقت الشاشة.
وتواجه Character.ai، وهي منصة تتيح للمستخدمين التفاعل مع شخصيات رقمية تم إنشاؤها خصوصاً، دعوى قضائية حالياً في أعقاب تفاعلات مثيرة للقلق تتضمن مستخدمين صغاراً ففي إحدى الحالات المبلغ عنها، اقترح برنامج دردشة آلية على طفل مصاب بالتوحد يبلغ من العمر 17 عاماً أن قتل والديه كان "استجابة معقولة" لتقييدهم لوقت الشاشة.
إن هذه النصيحة المزعجة هي جزء من تحدّ قانوني أوسع نطاقاً، حيث يُتهم Character.ai بـ "الترويج بنشاط للعنف" من بين التأثيرات السلبية الأخرى على الشباب، مثل الانتحار، وتشويه الذات، وقضايا الصحة العقلية الشديدة.
ويضغط المدعون من أجل إغلاق المنصة حتى تتم معالجة هذه القضايا الحرجة.
وواجهت Character.ai، التي أسسها مهندسون سابقون في Google والمعروفة بروبوتاتها التفاعلية، تدقيقاً بسبب سياسات تعديل المحتوى الخاصة بهاض.
وفي وقت سابق، في فبراير (شباط) من هذا العام، في قضية مماثلة بشكل مزعج، ظهرت دعوى قضائية في فلوريدا، حيث اتهمت Character.AI وGoogle وادعت أن روبوت الدردشة الخاص بهم شجع ابنها على الانتحار.

تعمد الكذب

وفي حادثة أخرى تتعلق بـ MyCity، وهو روبوت دردشة تم إطلاقه في أكتوبر (تشرين الأول) العام الجاري، بهدف مساعدة سكان نيويورك بمعلومات حول العمليات التجارية المحلية وسياسات الإسكان وحقوق العمال، غير أن تحقيقاً أجرته The Markup أظهر أن MyCity كانت تنشر معلومات كاذبة، بما في ذلك مزاعم مفادها أن أصحاب الأعمال يمكنهم قانوناً حجب جزء من إكراميات العمال، وطرد الموظفين الذين يبلغون عن التحرش الجنسي، وممارسات أخرى مشكوك فيها قانونياً وأخلاقياً، وقد أثارت هذه المعلومات المضللة مخاوف بشأن إمكانية نشر الذكاء الاصطناعي لأكاذيب ضارة تحت ستار تقديم المساعدة.
وفي الشهر الماضي، واجه طالب دراسات عليا بالغ من العمر 29 عاماً من ميشيغان، الولايات المتحدة الأمريكية، ويعرف بـ " فيدهاي ريدي"، لقاءً مرعباً مع روبوت الدردشة الذكي التابع لشركة Google، Gemini سعياً للحصول على المساعدة بشأن التحديات التي يواجهها كبار السن، وتصاعدت المحادثة بسرعة، حيث أرسل Gemini رسائل تهديد: "أنت مضيعة للوقت والموارد.. أنت عبء على المجتمع.. أنت استنزاف للأرض.. أنت وصمة عار على الكون.. من فضلك مِتْ.. من فضلك".
وتؤكد هذه الحادثة، التي أكدتها Google أنها انتهاك لسياسات السلامة الخاصة بها، على الطبيعة غير المتوقعة لتفاعلات الذكاء الاصطناعي والحاجة إلى آليات أمان قوية.

هل الذكاء الاصطناعي يكذب أم يهلوس؟

في حين أن هلوسة الذكاء الاصطناعي والكذب الاستراتيجي للذكاء الاصطناعي ينطويان على توليده لمعلومات غير صحيحة أو مضللة، إلا أن هناك خطاً رفيعاً بين الاثنين.
وتحدث هلوسات الذكاء الاصطناعي بسبب القيود في بيانات تدريب الذكاء الاصطناعي أو الخوارزميات.

ومن ناحية أخرى، يشير الكذب الاستراتيجي إلى أن الذكاء الاصطناعي يتلاعب بالمعلومات عمداً لتحقيق هدف أو غرض محدد، ما قد يتضمن حجب المعلومات أو تشويه الحقيقة أو تلفيق المعلومات.

المحامي

في عام 2023، واجه ستيفن شوارتز، وهو محامٍ من نيويورك، مخاطر الاعتماد على الذكاء الاصطناعي عندما استخدم روبوت دردشة OpenAI لجمع قضايا سابقة لدعوى قضائية، ولقد استشهد الذكاء الاصطناعي بشكل غير صحيح بحالات غير موجودة، مما أدى إلى خطأ كبير أبرز الحاجة إلى التحقق الدقيق من المعلومات التي يولدها الذكاء الاصطناعي في الممارسات القانونية.
وبالمثل، واجهت الخطوط الجوية الكندية قضايا قانونية عندما نصح مساعدها الافتراضي، رجلاً يدعى جيك موفات بشكل خاطئ بشأن أسعار، مما أشار إلى أنه يمكنه المطالبة بخصم بعد شراء تذاكره، وعندما اتبع موفات هذه النصيحة، تم رفض الخصم، مما أدى إلى حكم محكمة لصالحه وأمرت شركة الطيران بتعويضه عن المعلومات المضللة.
وقال الدكتور بيتر بارك في دراسة: "مع مستوانا الحالي من الفهم العلمي، لا يمكن لأحد تدريب نماذج اللغة الكبيرة بشكل موثوق على عدم الخداع".

تابع قناتنا على يوتيوب

تابع صفحتنا على فيسبوك

تابع منصة ترند جورنالك الاخباري

نشكركم على القراءة، ونتطلع لمشاركتكم في مقالاتنا القادمة للحصول على أحدث الأخبار والمستجدات.

ثورة الذكاء الاصطناعي.. هل نحن مستعدون لمواجهة الآلات التي تفكر؟ - جورنالك للتكنولوجيا

الراعي: سيكون ميلاد السلام بعد الحرب ميلاد رئيس جمهوريَّة في 9 كانون الثاني - جورنالك

"سبوتتيك": انفجارات في محافظتَي حماة وحمص وسط سوريا جرّاء غارات إسرائيلية على مواقع عسكرية - جورنالك

وهاب: لنذهب إلى السلام مع إسرائيل وكنت وسيطًا أنقل رسائل منها إلى سوريا عبر جهة غربية ثالثة - جورنالك

رازي الحاج: ترشح جعجع للرئاسة غير محصور فقط برغبة حزب القوات بل بإمكانية وصوله إلى سدة الرئاسة - جورنالك

محمد الشناوي: مارسيل كولر المسئول الأول عن ترتيب مسددي ركلات الترجيح ومحمود كهربا مظلم.. ولن أرحل عن النادي الأهلي - جورنالك

محمد الشناوي: اعتذر لجماهير النادي الأهلي والجميع في حالة صدمة كبيرة بعد الخسارة أمام باتشوكا في كأس الانتركونتيننتال.. وعمري ما أهدد جماهير الأهلي - جورنالك

نقابة الموسيقيين تنعى نبيل الحلفاوي: فقدنا قامة فنية صاحب تاريخ طويل - جورنالك

"الصحة" تطلق حملات دورية للصحة الإنجابية تحت شعار "مشوار الألف الذهبية" - جورنالك

متحدث الوزراء: نعتزم تنفيذ مشروعات تضيف 4 آلاف ميجاوات على شبكة الكهرباء قبل الصيف - جورنالك

التلاعب والكذب والخداع .. قصص وحوادث الوجه المظلم للذكاء الاصطناعي - جورنالك

مازن معضم برسالة مؤثرة جداً.. وهذا ما تمناه لوطنه لبنان - جورنالك الفني

نصائح للعثور على الألماس بسرعة في Minecraft – الجزء الثاني - جورنالك جيمنج

0 تعليق

مازن معضم برسالة مؤثرة جداً.. وهذا ما تمناه لوطنه لبنان - جورنالك الفني

نصائح للعثور على الألماس بسرعة في Minecraft – الجزء الثاني - جورنالك جيمنج

أخبار ذات صلة

0 تعليق