تكنولوجيا

خبير في غولدمان ساكس: عصر البيانات المفتوحة لتدريب الذكاء الاصطناعي وصل إلى نهايته

كشف نيما رافائيل، كبير مسؤولي البيانات ورئيس هندسة البيانات في شركة غولدمان ساكس، أن العالم بلغ مرحلة استُنفدت فيها تقريبًا جميع البيانات الأصلية المتاحة عبر الإنترنت لتدريب نماذج الذكاء الاصطناعي، وذلك وفق تقرير نشره موقع بيزنس إنسايدر.

وأوضح رافائيل أن هذا التغير الجوهرية أثّر بشكل مباشر على استراتيجيات بناء النماذج، مشيرًا إلى نموذج DeepSeek الصيني الذي تم تدريبه بتكلفة أقل مقارنة بالنماذج الأخرى الكبرى في سوق الذكاء الاصطناعي.

ورجّح أن انخفاض التكلفة يعود إلى اعتماد النموذج على بيانات جرى توليدها بواسطة نماذج ذكاء اصطناعي قائمة مسبقًا، بدلاً من الاعتماد على بيانات أصلية من الإنترنت. ورغم أن هذه الطريقة توفر كمًا ضخمًا من البيانات، فإنها قد تفتقر إلى الجودة العالية الموجودة في البيانات البشرية الأصلية، مما قد ينعكس سلبًا على مستوى أداء النماذج المدربة عليها.

وأشار رافائيل إلى أن البيانات التي تم استهلاكها بالكامل هي تلك الموجودة على الإنترنت المفتوح، لكنه أكد في الوقت ذاته أن الشركات ما تزال تملك “كنوزًا” من البيانات الخاصة غير المستغلة، مثل بيانات التعاملات المالية أو سجلات تفاعل العملاء، والتي يمكن أن تمثل المحرك الرئيسي للجيل القادم من نماذج الذكاء الاصطناعي.

وفي هذا السياق، يرى أن مرحلة تطوير الذكاء الاصطناعي ستنتقل إلى الاعتماد بشكل أكبر على البيانات الخاصة والإجراءات التشغيلية داخل المؤسسات، مشددًا على قيمة البيانات الداخلية لدى شركات عملاقة مثل غولدمان ساكس في تعزيز القدرات الذكية إذا تم استخدامها بالشكل الأمثل.

ويتفق مع هذا التقييم إيليا سوتسكيفر، الشريك المؤسس في أوبن إيه آي، الذي صرّح في وقت سابق بأن الشركات استنفدت تقريبًا البيانات المفيدة المتاحة عبر الإنترنت، وهو ما يمثل نقطة تحول قد تبطئ وتيرة التطور السريع الذي شهدته نماذج الذكاء الاصطناعي خلال الأعوام الماضية.

وأكد رافائيل أن جودة البيانات ستظل العامل الحاسم في مستقبل الذكاء الاصطناعي، محذرًا من أن الاعتماد المفرط على بيانات اصطناعية أو منخفضة الجودة قد يطرح تساؤلات حول اتجاهات الصناعة وقدرتها على الاستمرار في تحقيق قفزات تقنية كبيرة.

زر الذهاب إلى الأعلى