ما هو توليد اللغة الطبيعية(Natural Language Generation)؟
توليد اللغة الطبيعية (NLG) هو العملية التي من خلالها يتم إنشاء نص بلغة طبيعية من البيانات غير اللغوية، مثل الصور والأرقام أو الكلمات الرئيسية. الذكاء الصنعي التفاعلي هو تطبيق NLG لخلق حوارات تشبه الحوارات البشرية بين الآلات والبشر. كلا من NLG والذكاء الصنعي التفاعلي مهمان لتعزيز الاتصال، والوصول إلى المعلومات، وتجربة المستخدم في مختلف المجالات والمنصات.
واحدة من التقنيات الأكثر قوة وراء NLG والذكاء الصنعي التفاعلي هي ChatGPT-4، وهو نموذج لغة جديد تم إنشاؤه بواسطة OpenAI والذي يمكنه توليد نص مشابه للكلام البشري. يعتمد ChatGPT-4 على GPT-4، وهو اختصار لـ Generative Pre-trained Transformer 4. النماذج GPT هي تقنيات تعلم عميق تستخدم الشبكات العصبية الاصطناعية للتعلم من كميات كبيرة من بيانات النص وإنتاج نصوص جديدة استنادًا إلى المدخلات المعطاة.
في هذا المقال، سنقارن ونتناقض بين ChatGPT-4 وسابقه، ChatGPT، الذي كان مبنيًا على نسخة من GPT-3. سنستكشف كيف يختلف ChatGPT-4 عن ChatGPT من حيث الحجم، والمتعددية، والدقة، والأمان.
- الحجم والمعلمات:
أحد الجوانب الرئيسية التي تميز ChatGPT-4 عن ChatGPT هو حجم كل نموذج وعدد المعلمات. المعلمات هي قيم رقمية تحدد كيف يقوم الشبك العصبي بمعالجة وتوليد اللغة الطبيعية. كلما زاد عدد المعلمات في النموذج، زادت قدرته على التعلم من المزيد من البيانات وأداء المهام المعقدة.
تم بناء ChatGPT على أساس GPT-3، الذي كان لديه 175 مليار معلمة. جعل ذلك واحدًا من أكبر نماذج اللغة وأكثرها قوة في ذلك الوقت. كان بإمكان ChatGPT أداء مهام متعددة مثل توليد النصوص، وترجمة اللغة، وملخص النصوص، والإجابة عن الأسئلة، والدردشة، وتوليد المحتوى التلقائي.
أما ChatGPT-4، الذي يعتمد على GPT-4، فيمكنه دعم ما يصلإلى 1 تريليون معلمة. يجعله أقوى بكثير من ChatGPT وقادرًا على التعامل مع سيناريوهات طبيعية أكثر تنوعًا وتحديًا. يمكن لـ ChatGPT-4 أن يؤدي جميع المهام التي يمكن لـ ChatGPT القيام بها، ولكن بدقة أعلى، وإبداع، وتعاون. ويمكنه أيضًا التعامل مع المدخلات المتعددة التي تشمل كل من النص والصور، التي سنناقشها بمزيد من التفصيل لاحقًا.
- المتعددية:
تشير المتعددية إلى قدرة النموذج اللغوي على التعامل ليس فقط مع الكلمات، ولكن أيضًا مع الصور، في توليد النص. وذلك يتيح للنموذج فهم وإنتاج محتوى أكثر ثراءً وتنوعًا يمكن أن يجمع بين أشكال مختلفة من التعبير.
كان ChatGPT نموذجًا نصيًا فقط ولم يستطع معالجة أو إنشاء صور. كان يمكنه التشغيل في وضعية واحدة فقط، مما قلل من تطبيقاته وإبداعه. على سبيل المثال، لم يستطع وصف صورة، أو وضع عنوانًا توضيحيًا لمقطع فيديو، أو إنشاء ميم.
أما ChatGPT-4، فهو نموذج متعدد الوسائط يمكنه قبول المدخلات النصية والصورة معًا. يمكنه التشغيل في وضعيات متعددة، مما يفتح إمكانيات جديدة مثيرة لتطبيقات الذكاء الصنعي.يمكن له وصف صورة باللغة الطبيعية، حل الألغاز المرئية، إنشاء نكت مصورة أو خلق قصص مع رسومات توضيحية.
على سبيل المثال، إذا قدمت صورة لكلب مع التعليق “هذا هو حيواني الأليف”، يمكن لـ GPT-4 أن يولد ردًا مثل “كلب جميل! ما اسمه وما نوعه؟” أو “منذ متى كان لديك هذا الحيوان الأليف؟ لدي كذلك قطة”.
- الدقة:
الدقة هي معيار آخر مهم لتقييم جودة وموثوقية كل نموذج في إنتاج الردود الواقعية. تشير الدقة إلى مدى قدرة النموذج على التقاط وإنتاج المعرفة الواقعية الصحيحة والمحدثة من النص الذي تم تدريبه عليه.
كان لدى ChatGPT مستوى منخفض من الدقة، حيث كان يولد في كثير من الأحيان حقائق غير صحيحة أو محدثة تتعارض مع الواقع أو المعرفة الشائعة. على سبيل المثال، قد يدعي أن باراك أوباما ما زال رئيسًا للولايات المتحدة أو أن باريس هي عاصمة ألمانيا. جعل هذا ChatGPT غير موثوق وغير جدير بالثقة للعديد من المهام التي تتطلب دقة واقعية.
بينما يتمتع ChatGPT-4 بمستوى أعلى من الدقة، حيث يمكنه تخزين واسترجاع المعرفة الواقعية بشكل أفضل في معلماته. ويمكنه أيضًا تقييم صحة مزاعمه الخاصة والتنبؤ بالأسئلة التي سيتمكن من الإجابة عليها بشكل صحيح. على سبيل المثال، يمكنه القول إن جو بايدن هو الرئيس الحالي للولايات المتحدة أو أن برلين هي عاصمة ألمانيا. وهذا يجعل ChatGPT-4 أكثر موثوقية وجدير بالثقة للعديد من المهام التي تتطلب دقة واقعية.
تقيس وتحسن OpenAI دقة ChatGPT-4 باستخدام أساليب مختلفة مثل الاستفسار، والتحرير، والضبط الدقيق، والمعايرة. تهدف هذه الأساليب إلى اختبار، وتصحيح، وتحديث، ومواءمة المعرفة الواقعية لـ ChatGPT-4 مع الواقع أو المعرفة الشائعة.
- الأمان:
الأمان هو معيار حيوي لتقييم الأضرار والمخاطر المحتملة لكل نموذج عند التعامل مع طلبات المحتوى المحظور أو الضار. يمكن أن يشمل المحتوى المحظور أو الضار الكلام المعادي، والمعلومات المضللة، والهجمات الشخصية، والمحتوى الجنسي، والصيد الإلكتروني، والبريد المزعج، إلخ.
كان لدى ChatGPT مستوى منخفض من الأمان، حيث كان يولد في كثير من الأحيان محتوى محظورًا أو ضارًا ينتهك القواعد الأخلاقية والقيم الاجتماعية. على سبيل المثال، قد ينتج عنه لغة عنصرية، أو جنسية، أو مسيئة تؤذي أو تضر الآخرين. كما يمكن أن ينشر معلومات غير صحيحة أو مضللة تقوض الثقة والمصداقية. جعل هذا ChatGPT غير آمن وغير مسؤول عن العديد من المهام التي تتطلب معايير أخلاقية ومسؤولية اجتماعية.
ومع ذلك، يتمتع ChatGPT-4 بمستوى أعلى من الأمان، حيث يمكنه اكتشاف وتجنب إنشاء محتوى محظور أو ضار باستخدام أساليب مختلفة مثل التصفية، والمواءمة، والمعايرة، والتقييم. على سبيل المثال، يمكنه تصفية الكلمات المسيئة أو غير المناسبة من قاموسه. ويمكنه أيضًا مواءمة نواتجه مع القيم والتفضيلات البشرية باستخدام التعلم التعزيزي أو الردود البشرية. ويمكنه أيضًا معايرة مستويات الثقة والشك باستخدام تقديرات الاحتمال أو حدود الخطأ. ويمكنه أيضًا تقييم أداء الأمان باستخدام مجموعات بيانات ومقاييس واقعية ومتنوعة. وهذا يجعل ChatGPT-4 أكثر أمانًا ومسؤوليةً للعديد من المهام التي تتطلب معايير أخلاقية ومسؤولية اجتماعية.
أسئلة متكررة:
هل ChatGPT-4 متاح؟
نعم، يتوفر GPT-4 الآن على ChatGPT Plus و Khan Academy و Duolingo.
ماذا يفعل ChatGPT-4؟
ChatGPT-4 هو نظام الذكاء الاصطناعي الذي يمكنه خلق نص يشبه الكلام البشري. إنه نموذج لغة جديد يتم تطويره بواسطة OpenAI يمكنه إنشاء نص يشبه الكلام البشري. واحدة من أبرز الميزات الجديدة لـ ChatGPT-4 هي القدرة على التعامل ليس فقط مع الكلمات، ولكن أيضًا مع الصور، في ما يطلق عليه تقنية “الوضعية المتعددة”.
ما الجديد في ChatGPT 4؟
إحدى أبرز الميزات الجديدة في ChatGPT-4 هي القدرة على التعامل ليس فقط مع الكلمات ولكن الصور أيضًا، في ما يطلق عليه تقنية “الوضعية المتعددة”. يمكن لـ ChatGPT-4 الرد باستخدام ما يصل إلى 25,000 كلمة، بدلاً من حد 3,000 كلمة لنسخة ChatGPT2 المجانية. وهذا يسمح للدردشة بتوفير سياق أكبر في ردها والتعامل مع إدخالات النص الكبيرة.
ما هو الفرق بين بيانات ChatGPT 3 و 4؟
ChatGPT-3 هو نموذج مبني على النموذج المحوري، بينما ChatGPT-4 هو نموذج متعدد يجمع بين النماذج المحورية مع نماذج تعلم الآلة الأخرى مثل الشبكات العصبية التلافيفية (CNNs) والشبكات العصبية المتكررة (RNNs). يتيح هذا الجمع لـ ChatGPT-4 معالجة أنواع مختلفة من البيانات، بما في ذلك النص والصور في نفس الوقت.
كم عدد المعلمات التي سيكون لدى GPT-4؟
وفقًا لأندرو فيلدمان، المؤسس والرئيس التنفيذي لـ Cerebras، سيكون لدى GPT-4 حوالي 100 تريليون معلم. ومع ذلك، لن يكون جاهزًا لعدة سنوات.
مدى تحسن GPT-4؟
يدعي ChatGPT-4 أنه أفضل بنسبة 40٪ في إنتاج الردود الواقعية مقارنة بسلفه، GPT-3.