تجاوز إلى المحتوى الرئيسي

غوغل: دقة روبوتات الدردشة بالذكاء الاصطناعي لا تتجاوز 70%

Image
غوغل: دقة روبوتات الدردشة بالذكاء الاصطناعي لا تتجاوز 70%
+A
حجم الخط
-A

الثانية | وكالات
 

أكدت شركة غوغل أن دقة روبوتات الدردشة المعتمدة على النماذج اللغوية للذكاء الاصطناعي لا تتجاوز 70% في كثير من الحالات، وفق دراسة موسّعة نشرتها عبر تقرير أورده موقع «Digital Trends» الأمريكي المتخصص في التكنولوجيا.

وأظهرت الدراسة أن النماذج تخطئ في نحو سؤال من كل ثلاثة، حتى عندما تبدو الإجابات منطقية. وتصدّر نموذج «جيميناي 3 برو» النتائج بنسبة تجاوزت 69%، يليه «جيميناي 2.5 برو» بنسبة 62%، ثم «تشات جي بي تي 5» بنسبة 61.8%، بينما سجّل «كلود أوبس 4.5» و«غروك» نسباً أقل بلغت 51% و53% على التوالي.

واعتمد التقييم على أربعة معايير شملت دقة المعرفة الداخلية، والبحث عبر الإنترنت، والتعامل مع المحتوى البصري، والقدرة على تقديم إجابات متسقة مع السياق. وأظهرت النتائج تفوق «تشات جي بي تي 5» في معايير البحث والأساس، مقابل ضعف عام في معيار تعدد الوسائط لدى معظم النماذج، في حين سجّل «غروك 4 فاست» أدنى متوسط بلغ 36%، وتراجع إلى 15% في المعيار البارامتري.

وحذّرت غوغل من أن محدودية الدقة في الاختبارات المتخصصة قد تُسبب أضراراً كبيرة في القطاعات الحساسة، مثل الصحة والمالية، حتى مع نسب خطأ تبدو محدودة.