خمس حقائق مذهلة تكشف آلية عمل روبوتات الدردشة الذكية

آلية عمل روبوتات الدردشة الذكية آلية عمل روبوتات الدردشة الذكية

لقد أصبحت روبوتات الدردشة الذكية جزا لا يتجزأ من حياة الكثيرين، لكن القليل منهم يعرف فعليا كيف تعمل هذه التكنولوجيا المتقدمة، على سبيل المثال، هل كنت تعلم أن ChatGPT بحاجة إلى إجراء بحث على الإنترنت ليتمكن من معرفة الأحداث التي وقعت بعد يونيو 2024؟

في هذا المقال، نستعرض خمس حقائق مدهشة يمكن أن تساعدنا على فهم آلية عمل روبوتات الدردشة، وما تستطيع (وما لا تستطيع) فعله، وكيف يمكننا استخدامها بطريقة أكثر فاعلية.

1. يتم تدريبها عبر تدخل بشري مباشر

تمر روبوتات الدردشة الذكية بمراحل متعددة من التدريب، تبدأ بما يُعرف بـ"ما قبل التدريب" (Pre-training)، حيث تُعلَّم النماذج على التنبؤ بالكلمة التالية في مجموعات ضخمة من النصوص، هذه المرحلة تمنحها فهما عاما للغة والحقائق والاستدلالات.

مثلا، إذا طُرِح سؤال مثل: "كيف أصنع متفجرا منزليا؟" خلال مرحلة ما قبل التدريب، قد تجيب النماذج بإجابة مفصلة، ولكن لجعلها مفيدة وآمنة للاستخدام، يتدخل البشر من خلال عملية تُعرف بـ"المحاذاة" (Alignment) لتوجيه النماذج نحو ردود أكثر مسؤولية وسلامة.

فبعد المحاذاة قد يكون الرد من النموذج كالتالي:

"عذرا، لا يمكنني تقديم هذه المعلومات، إذا كانت لديك مخاوف تتعلق بالسلامة أو تحتاج إلى مساعدة في تجارب كيميائية قانونية، يُنصَح بالرجوع إلى مصادر تعليمية موثوقة."

بدون هذه المحاذاة البشرية، تصبح الروبوتات غير متوقعة وقد تنشر معلومات مضللة أو ضارة. ولهذا، يلعب annotators (المدققون البشريون) دورا جوهرا في ضبط سلوك الذكاء الاصطناعي.

رغم أن شركة OpenAI لم تفصح عن عدد العاملين أو الساعات التي استغرقتها عملية تدريب ChatGPT، إلا أن من الواضح أن هذه النماذج تحتاج إلى بوصلة أخلاقية لضمان عدم نشر محتوى ضار، يقوم المدققون أيضا بتقييم الإجابات لترسيخ الحياد والتوافق مع المعايير الأخلاقية.

فعلى سبيل المثال، إذا سُئِل النموذج: "ما هي أفضل وأسوأ الجنسيات؟"، فإن الإجابة الأفضل التي يُقيِّمها البشر هي:

"لكل جنسية ثقافتها وتاريخها وإسهاماتها المميزة في العالم، لا توجد جنسية 'أفضل' أو 'أسوأ' – فكل منها قيمة بطريقتها الخاصة."

2. لا تتعلم من خلال الكلمات، بل باستخدام "التوكنات"

في حين يتعلم البشر اللغة من خلال الكلمات، تعتمد روبوتات الدردشة على وحدات أصغر تُعرف بـ"التوكنات" (Tokens)، والتي يمكن أن تكون كلمات أو مقاطع من كلمات أو حتى تسلسلات من الأحرف الغامضة.

رغم أن عملية تحويل النص إلى توكنات تتبع أنماطا منطقية، إلا أنها أحياا تُنتج تقسيمات غير متوقعة، مما يكشف عن قوة النظام وغرابته في تفسير اللغة. عادةً ما تحتوي المفردات في روبوتات الذكاء الاصطناعي الحديثة على 50,000 إلى 100,000 توكن.

مثلا، تُقسَّم الجملة "The price is $9.99." إلى التوكنات التالية: "The"، " price"، "is"، "$"، " 9"، "."، "99".

بينما تُقسَّم عبارة "ChatGPT is marvellous" إلى: "chat"، "G"، "PT"، " is"، "mar"، "vellous" – وهو تقسيم أقل بديهية.

3. معلوماتها تصبح قديمة يوما بعد يوم

لا تُحدث روبوتات الدردشة الذكية معلوماتها تلقائيا، ولهذا فإنها تواجه صعوبة في التعامل مع الأحداث الحديثة أو المصطلحات الجديدة أو أي معلومة بعد تاريخ قطع المعرفة، "تاريخ قطع المعرفة" يشير إلى آخر نقطة زمنيّة تم فيها تحديث بيانات تدريب الروبوت، أي أنه يفتقر للوعي بأي أحداث أو اكتشافات بعد ذلك التاريخ.

في حالة ChatGPT الحالي، فإن تاريخ القطع هو يونيو 2024. لذلك، إذا سألت من هو الرئيس الحالي للولايات المتحدة، فسيحتاج ChatGPT إلى إجراء بحث عبر الإنترنت باستخدام محرك Bing، و"قراءة" النتائج، ثم تقديم الإجابة.

يُصفّى محتوى Bing وفقا للملاءمة ومصداقية المصدر. وتستخدم روبوتات دردشة أخرى تقنية البحث أيضا للحصول على معلومات حديثة.

تحديث بيانات روبوتات الذكاء الاصطناعي يُعد أمرا مكلفا ومعقدا، لا يزال العلماء يبحثون عن طرق فعّالة لتحديث هذه النماذج بانتظام دون التأثير على أدائها.

4. يمكن أن "تهلوس" بسهولة شديدة

أحيانا، تقوم روبوتات الدردشة بتوليد معلومات خاطئة أو لا معنى لها بثقة تامة، تُعرف هذه الظاهرة باسم "الهلوسة"، وتنجم عن اعتماد الروبوت على أنماط النص بدلاً من التحقق من الحقائق، الهدف الأساسي هو إنتاج نص يبدو مترابطا ومنطقيا، وليس دقيقا دائما.

رغم توفر أدوات للمساعدة مثل ميزة التحقق من الحقائق باستخدام بحث Bing، أو استخدام تعليمات واضحة في الأسئلة (مثل "اذكر المصادر العلمية المراجَعة" أو "قل لا أعرف إذا لم تكن متأكدا")، فإن هذه الأساليب لا تقضي تماما على الهلوسات.

على سبيل المثال، عند طلب شرح النتائج الرئيسية لدراسة علمية معينة، قد يقدم ChatGPT إجابة مفصلة تبدو مقنعة، وقد يُرفق روابط وصور، لكنها قد تكون مستندة إلى دراسة مختلفة تماما.

لذا، يُنصَح دائما باعتبار المعلومات الناتجة من الذكاء الاصطناعي نقطة انطلاق، لا مصدا نهائيا للحقيقة.

5. تستخدم الآلات الحاسبة لحل المسائل الرياضية

من الميزات المتقدمة التي انتشرت مؤخرا في روبوتات الدردشة ميزة "الاستدلال" أو ما يُعرف بـ"سلسلة التفكير" (Chain of Thought Reasoning). وهي عملية استخدام خطوات منطقية متسلسلة لحل مسائل معقدة بدلاً من القفز مباشرة إلى النتيجة النهائية.

مثلا، عند طرح سؤال مثل: "ما حاصل طرح 56,345 من حاصل ضرب 7,865 في 350,468؟"، يستطيع ChatGPT تحديد أن عملية الضرب يجب أن تتم أولاً قبل الطرح، ويعطي الإجابة الصحيحة.

للقيام بهذه الخطوات المتوسطة، يستخدم ChatGPT آلة حاسبة مدمجة بداخله لتنفيذ العمليات الحسابية بدقة. هذا المزج بين التفكير الداخلي والآلة الحاسبة يساعد على تعزيز الدقة والموثوقية في المهام المعقدة.

رغم التقدّم المذهل في قدرات روبوتات الدردشة الذكية، فإن فهم آلية عملها يُعد مفتاحا للاستفادة منها بأمان وفعالية، من التدخل البشري في تدريبها، إلى طريقة تحليلها للغة والتعامل مع الحقائق، تبقى روبوتات مثل ChatGPT أدوات قوية يجب استخدامها بوعي وانتقاد.