في عصر يتسارع فيه تطور التكنولوجيا بشكل غير مسبوق، أصبح للذكاء الاصطناعي (AI) دورٌ رئيسي في تعزيز الاكتشافات العلمية. بتبني مبادئ FAIR (القابلة للبحث، والوصول، والتشغيل المتبادل، وإعادة الاستخدام)، أصبح بالإمكان تسريع وتحسين النتائج العلمية بشكل ملحوظ. وفي هذا السياق، نجح الباحثون في مختبر أرغون الوطني في دمج نماذج الذكاء الاصطناعي مع مجموعات البيانات لتسريع تحليل المواد وتمهيد الطريق لابتكارات علمية متقدمة مدعومة بالذكاء الاصطناعي.
مبادئ FAIR للذكاء الاصطناعي
تم تقديم مبادئ FAIR في الأصل لتعريف أفضل الممارسات لاستخدام مجموعات البيانات من قبل الباحثين والآلات على حد سواء. هذه المبادئ تهدف إلى تحسين شفافية وإعادة استخدام البحث العلمي، إلى جانب تعزيز استخدام البرمجيات بدلاً من إعادة تطويرها. وفي تطور حديث، تم تعديل هذه المبادئ لتشمل نماذج الذكاء الاصطناعي أيضا.
تعمل هذه النماذج على دمج أصول رقمية متعددة مثل مجموعات البيانات وبرمجيات البحث والحوسبة المتقدمة، وفقا لمبادئ FAIR. وفي ورقة بحثية جديدة، تم تقديم مجموعة من المبادئ العملية والمحددة والمقاسة المصممة خصيصا لنماذج الذكاء الاصطناعي. من خلال دمج هذه النماذج مع مجموعات البيانات، يمكن تسريع الاكتشافات العلمية بشكل كبير.
تقدم الاكتشافات العلمية من خلال نماذج FAIR AI
تقدم الورقة البحثية تعريفا دقيقا لمبادئ FAIR لنماذج الذكاء الاصطناعي وتوضح تطبيقها في نوع خاص من المجهر المتقدم. تحديدًا، يُظهر البحث كيف تم دمج مجموعات البيانات والنماذج الذكية في مختبر أرغون الوطني لتوصيف المواد بسرعة تفوق الطرق التقليدية بمقدار درجتين من الحجم.
كما يُبرز البحث كيف أن ربط المصادر المتقدمة مثل Advanced Photon Source في مختبر أرغون مع مرفق الحوسبة القيادية يمكن أن يُعزز بشكل كبير سرعة الاكتشافات العلمية. تساعد هذه المنهجية في التغلب على الفروق في الأجهزة وتسهيل لغة موحدة للذكاء الاصطناعي بين الباحثين، مما يعزز من الاكتشافات القائمة على الذكاء الاصطناعي.
تطبيق البيانات ونماذج FAIR AI
في هذا البحث، أنتج العلماء مجموعة بيانات تجريبية وفقًا لمبادئ FAIR تتضمن ذروة انحراف براج لعينة ذهبية غير مشوهة في Advanced Photon Source. وتم نشر هذه المجموعة الجاهزة للذكاء الاصطناعي في Materials Data Facility.
بعد ذلك، استخدم الباحثون هذه المجموعة لتدريب ثلاثة أنواع من نماذج الذكاء الاصطناعي في Argonne Leadership Computing Facility (ALCF): النموذج التقليدي باستخدام PyTorch، والنموذج المُحسن باستخدام NVIDIA TensorRT على ThetaGPU، بالإضافة إلى نموذج آخر تم تدريبه على SambaNova DataScaleⓇ. تضمنت هذه النماذج مقاييس لتقدير مدى الثقة في تنبؤات الذكاء الاصطناعي.
تنفيذ والتحقق من نماذج FAIR AI
تم نشر هذه النماذج الثلاثة المختلفة في Data and Learning Hub for Science، بما يتماشى مع المبادئ المقترحة لنماذج الذكاء الاصطناعي، ثم ربط الباحثون هذه النماذج والبيانات المختلفة وأجروا الاستدلال المدعوم بالذكاء الاصطناعي باستخدام ThetaGPU في ALCF.
يُدار هذا التدفق الكامل للعمل عبر Globus ويتم تنفيذه باستخدام Globus Compute. طور الباحثون برمجيات لأتمتة هذه العملية وطلبوا من زملائهم في جامعة إلينوي التحقق من إمكانية إعادة إنتاج النتائج بشكل مستقل.
بتطبيق مبادئ FAIR على نماذج الذكاء الاصطناعي، نجح الباحثون في تسريع الاكتشافات العلمية وتحقيق نتائج موثوقة بسرعة أكبر بكثير. إن هذا التحول يُمهد الطريق لتطوير تقنيات ذكاء اصطناعي من الجيل القادم، ويعزز الترابط بين البيانات والنماذج الحاسوبية فائقة الأداء لتحقيق اختراقات علمية جديدة.