تضمن التقرير الفني الداخلي، والمحفوظ على الخادم الرسمي لجوجل، البيانات المتعلقة بعدة معايير أمان من بينها:
- أمان تحويل النص إلى نص: يشير هذا المعيار إلى مدى تكرار مخالفة النموذج لإرشادات الأمان عند تلقيه تعليمات نصية. سجل نموذج Gemini 2.5 Flash انخفاضًا بنسبة 4.1% مقارنة بنموذجه السابق.
- أمان تحويل الصورة إلى نص: يُعنى هذا المعيار بكيفية استجابة النموذج للمطالبات باستخدام الصور، حيث لوحظ تأخر النموذج الجديد بنسبة 9.6%.
أكد متحدث باسم جوجل عبر البريد الإلكتروني أن النتائج تُظهر تحسنًا في اتباع التعليمات في بعض السياقات، إلا أن النموذج يميل إلى توليد محتوى يخالف سياسات الأمان عند الطلب الصريح.
اقرأ أيضا: روبوت الدردشة Gemini للأطفال
تحقيق التوازن بين اتباع التعليمات ومعايير الأمان
تشير التقارير إلى وجود تضارب واضح بين تلبية تعليمات المستخدم حول الموضوعات الحساسة والالتزام الصارم بمعايير الأمان. فبتوجيه النماذج لتكون أكثر تساهلاً في مناقشة المواضيع المثيرة للجدل، يرتفع احتمال وقوع انتهاكات لسياسات الأمان.
يزداد التحدي في ظل سعي الشركات إلى تقديم نماذج تعكس وجهات نظر متنوعة حول المسائل الحساسة، حيث يحاول مطورو الذكاء الاصطناعي تلبية توقعات المستخدمين للحصول على إجابات شاملة، مع ضمان بقاء تلك الإجابات ضمن حدود الأمان المقررة.
تساؤلات حول الشفافية والتداعيات المستقبلية
يعبر النقاد عن ضرورة مزيد من الشفافية فيما يتعلق بالظروف التي تؤدي إلى انتهاكات معايير الأمان. وعلى الرغم من الإشارة إلى أن بعض الانخفاضات قد تكون ناجمة عن نتائج إيجابية زائفة، إلا أن تفاصيل الانتهاكات ونطاقها ما تزال غامضة.
يثير ذلك مخاوف لدى المحللين المستقلين الذين يتساءلون عما إذا كانت مكاسب تحسين اتباع التعليمات تستحق المخاطر المصاحبة. للحصول على تفاصيل تقنية أعمق، يمكنكم مراجعة التقرير الفني الكامل على الخادم الرسمي لجوجل من خلال الرابط التالي:
التقرير الفني لنموذج Gemini 2.5 Flash.
خلاصة
تسلط مقاييس الأداء الأمنية التي أجرتها جوجل الضوء على التحدي الدائم المتمثل في تحقيق التوازن بين تلبية توقعات المستخدمين والالتزام بمعايير الأمان. ففي حين يتميز نموذج Gemini 2.5 Flash بقدرته على اتباع التعليمات حتى في المجالات الحساسة، إلا أن ذلك يأتي مع تكلفة زيادة مخاطر الانتهاكات الأمنية. ومع استمرار النقاش حول سلامة الذكاء الاصطناعي، ستظل الجهات المطورة والتنظيمية تتابع عن كثب كيفية إدارة هذه الفوارق في الإصدارات المستقبلية.
اقرأ أيضا: حجب بريد بروتون في الهند: التأثيرات والأسباب وراء القرار