أحدثت شركة ناشئة صينية تُدعى DeepSeek ضجة كبيرة في عالم التكنولوجيا والأسواق المالية بعد إطلاقها نموذجا للذكاء الاصطناعي يُدعى DeepSeek-R1، والذي تفوَّق على أحدث نماذج OpenAI بتكلفة تطوير أقل واستخدام رقائق إلكترونية أقل قوة.
في يوم الاثنين، أصبح تطبيق DeepSeek الأعلى تقييما في متجر آبل الأمريكي، مما أدى إلى تراجع أسهم شركات التكنولوجيا الكبرى، ولكن ما الذي يجعل هذا النموذج الصيني مميزا؟
تفاصيل النموذج الصيني:
تقع شركة DeepSeek في مدينة هانغتشو الصينية، وقد استخدمت رقائق Nvidia H800 ذات القدرات المحدودة لتدريب نموذجها، على الرغم من امتلاكها مخزونا من رقائق Nvidia A100 عالية الأداء التي حصلت عليها قبل الحظر الأمريكي على تصدير الرقائق المتطورة إلى الصين.
يقول أنيل أنانثاسوامي، مؤلف كتاب Why Machines Learn: The Elegant Math behind Modern AI، إن DeepSeek-R1 يحتوي على حوالي 670 مليار معلمة، مما يجعله أكبر نموذج لغوي مفتوح المصدر حتى الآن، ومع ذلك يستخدم النموذج تقنية تُسمى خليط الخبراء، والتي تُفعِّل فقط جزءا صغيرا من هذه المعلمات لأي استعلام، مما يقلل من تكاليف الحوسبة.
تكلفة منخفضة وكفاءة عالية:
في حين كلف تدريب نموذج GPT-4 التابع لـOpenAI أكثر من 100 مليون دولار، تم تطوير DeepSeek-R1 بأقل من 6 ملايين دولار فقط، بالإضافة إلى ذلك يُقدَّم التطبيق مجانا للمستخدمين، بينما تبلغ تكلفة النسخة المماثلة من ChatGPT 200 دولار شهريا.
تقول أشليشا نيشاريكار الرئيسة التنفيذية لشركة Plano Intelligence: "لقد رأينا حتى الآن أن نجاح الشركات الكبرى في الذكاء الاصطناعي كان يُقاس بكمية الأموال التي جمعتها، وليس بالضرورة بالتكنولوجيا نفسها، أعتقد أننا سنولي المزيد من الاهتمام للتكنولوجيا التي تدعم منتجات هذه الشركات."
تأثيرات بيئية وأكاديمية:
يُعد نموذج DeepSeek-R1 أكثر كفاءة من الناحية البيئية، حيث يستهلك طاقة أقل بنسبة تصل إلى 90% مقارنة بالمنافسين، كما أن تكلفة تشغيله أقل بعشر مرات من النماذج المماثلة، مما يجعله خيارا مثاليا للباحثين الأكاديميين والشركات الناشئة.
ويضيف هانشينغ كاو الأستاذ المساعد في جامعة إيموري: "بالنسبة للباحثين الأكاديميين أو الشركات الناشئة، فإن هذا الفارق في التكلفة يعني الكثير."
مفتوح المصدر: خطوة نحو الشفافية:
أحد الجوانب المهمة في DeepSeek-R1 هو أن الشركة جعلت الكود الخاص بالنموذج مفتوح المصدر، بينما تظل بيانات التدريب خاصة، هذا يعني أن الباحثين يمكنهم التحقق من آلية عمل النموذج وتحسينه، مما يعزز الشفافية والابتكار في مجال الذكاء الاصطناعي.
يُظهر نجاح DeepSeek-R1 أن التكنولوجيا الصينية قادرة على المنافسة بقوة في سوق الذكاء الاصطناعي العالمي، حتى مع وجود تحديات مثل الحظر التكنولوجي، مع انخفاض التكاليف وزيادة الكفاءة، قد يشهد المستقبل تحولا كبيرا في كيفية تطوير واستخدام نماذج الذكاء الاصطناعي.