"قد ينتهي الأمر بغروك 5 شبه مثالي في اختبار الإنسانية الأخير وربما يشير إلى أخطاء في السؤال. حتى Grok 4، الذي أصبح بدائيا في هذه المرحلة، أعتقد أنه حصل على 52٪ باستثناء الأسئلة البصرية." إيلون ماسك