مسرد المصطلحات

التضمينات

تعرّف على ماهية التضمينات وكيف تعمل على تعزيز الذكاء الاصطناعي من خلال التقاط العلاقات الدلالية في البيانات من أجل معالجة اللغات الطبيعية والتوصيات والرؤية الحاسوبية.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

في مجال التعلم الآلي (ML) والذكاء الاصطناعي (AI)، تعد التضمينات تقنية أساسية لتمثيل البيانات المعقدة - مثل الكلمات أو الجمل أو الصور أو غيرها من العناصر - كمتجهات عددية كثيفة في فضاء متعدد الأبعاد. يتم تعلم هذا التحويل من البيانات، مما يتيح للخوارزميات التقاط المعنى الدلالي أو السياق أو الخصائص الأساسية للمدخلات. تتمثل الميزة الأساسية في أن العناصر التي تعتبر متشابهة بناءً على بيانات التدريب يتم تعيينها إلى نقاط قريبة في "فضاء التضمين" هذا، مما يسمح للآلات بفهم العلاقات والأنماط المعقدة بشكل أكثر فعالية بكثير من التمثيلات المتفرقة التقليدية مثل الترميز أحادي النقطة.

ما هي التضمينات؟

التضمينات هي تمثيلات متجهة مكتسبة منخفضة الأبعاد نسبيًا للمتغيرات المنفصلة (مثل الكلمات) أو الكائنات المعقدة (مثل الصور أو ملفات تعريف المستخدمين). وعلى عكس طرق مثل الترميز الأحادي الب ُعد الذي ينشئ متجهات متناثرة عالية الأبعاد حيث يتوافق كل بُعد مع عنصر واحد ويفتقر إلى معلومات العلاقة المتأصلة، فإن التضمينات هي متجهات كثيفة (عادةً ما تحتوي على عشرات إلى آلاف الأبعاد) حيث يساهم كل بُعد في تمثيل خصائص العنصر. والأهم من ذلك هو أن موضع هذه المتجهات في فضاء التضمين يجسد العلاقات الدلالية. على سبيل المثال، في تضمينات الكلمات، فإن الكلمات ذات المعاني المتشابهة أو المستخدمة في سياقات متشابهة، مثل "ملك" و"ملكة" أو "يمشي" و"ركض"، سيكون لها متجهات متقاربة رياضيًا (على سبيل المثال، باستخدام تشابه جيب التمام). يعكس هذا التقارب التشابه الدلالي المستفاد من البيانات.

كيف تعمل التضمينات

عادةً ما يتم إنشاء التضمينات باستخدام نماذج الشبكات العصبية (NN) التي يتم تدريبها على مجموعات بيانات كبيرة من خلال تقنيات مثل التعلم الذاتي الخاضع للإشراف. على سبيل المثال، تتضمن إحدى التقنيات الشائعة لتضمين الكلمات، والتي تتمثل في Word2Vec، تدريب نموذج للتنبؤ بكلمة ما بناءً على الكلمات المحيطة بها (سياقها) ضمن مجموعة نصوص ضخمة. أثناء عملية التدريب هذه، تقوم الشبكة بتعديل متغيراتها الداخلية، بما في ذلك متجهات التضمين لكل كلمة، لتقليل أخطاء التنبؤ عبر طرق مثل الترحيل العكسي. وتشفّر المتجهات الناتجة ضمنيًا المعلومات النحوية والدلالية. ويُعد عدد الأبعاد في فضاء التضمين معيارًا بالغ الأهمية يؤثر على قدرة النموذج على التقاط التفاصيل مقابل تكلفته الحسابية ومخاطر الإفراط في التضمين. غالبًا ما يتطلب تصور مساحات البيانات عالية الأبعاد هذه تقنيات تقليل الأبعاد مثل t-SNE أو PCA، والتي يمكن استكشافها باستخدام أدوات مثل TensorFlow Projector.

تطبيقات التضمينات

تعد التضمينات مكونات أساسية في العديد من أنظمة الذكاء الاصطناعي الحديثة في مختلف المجالات:

  • معالجة اللغات الطبيعية (NLP): تمثل التضمينات كلمات أو جمل أو مستندات كاملة. وتعتمد النماذج مثل بنية BERT و Transformer اعتمادًا كبيرًا على التضمينات لفهم الفروق اللغوية الدقيقة لمهام مثل الترجمة الآلية وتحليل المشاعر والإجابة على الأسئلة وتشغيل البحث الدلالي الفعال. مثال على ذلك: يستخدم روبوت الدردشة لدعم العملاء تضمين الجمل للعثور على الإجابة الأكثر صلة في قاعدته المعرفية حتى لو لم يستخدم استعلام المستخدم الكلمات الرئيسية الدقيقة.
  • أنظمة التوصية: يمكن أن تمثل التضمينات المستخدمين والعناصر (مثل الأفلام أو المنتجات أو المقالات). من خلال تعلم التضمينات بحيث يكون المستخدمون والعناصر التي يحبونها متقاربين في مساحة التضمين، يمكن للأنظمة أن توصي بعناصر جديدة مشابهة لتلك التي تفاعل معها المستخدم سابقًا أو أعجب بها مستخدمون مشابهون(التصفية التعاونية). تستخدم شركات مثل نتفليكس وأمازون هذا الأمر على نطاق واسع.
  • الرؤية الحاسوبية (CV): يمكن تحويل الصور أو رقع الصور إلى تضمينات تلتقط السمات البصرية. يعد هذا الأمر أساسيًا لمهام مثل استرجاع الصور (العثور على صور متشابهة بصريًا)، وتصنيف الصور، ويعمل كأساس لمهام أكثر تعقيدًا مثل اكتشاف الأجسام وتجزئة الصور التي تقوم بها نماذج مثل Ultralytics YOLO. مثال: تستخدم إحدى منصات التجارة الإلكترونية تضمين الصور للسماح للمستخدمين بتحميل صورة لعنصر ملابس والعثور على منتجات مماثلة في الكتالوج الخاص بهم. تعمل منصات مثل Ultralytics HUB على تسهيل تدريب ونشر مثل هذه النماذج.
  • تحليلات الرسوم البيانية: يمكن أن تمثل التضمينات العُقد والحواف في الرسوم البيانية، وتلتقط بنية الشبكة وعلاقات العُقد لمهام مثل التنبؤ بالرابط أو اكتشاف المجتمع، وغالبًا ما تستخدم الشبكات العصبية البيانية (GNNs).

التضمينات مقابل المفاهيم ذات الصلة

من المفيد التمييز بين التضمينات والمصطلحات ذات الصلة:

  • التضمينات مقابل استخراج الميزات: التضمينات هي شكل متطور وآلي في كثير من الأحيان من أشكال استخراج الميزات التي يتم تحقيقها من خلال التعلم العميق. في حين أن هندسة الميزات التقليدية قد تتضمن تحديد الميزات يدويًا (على سبيل المثال، الرسوم البيانية اللونية للصور)، فإن التضمينات تتعلم الميزات ذات الصلة مباشرةً من البيانات أثناء التدريب.
  • التضمينات مقابل البحث عن المتجهات / قواعد البيانات المتجهة: التضمينات هي التمثيلات المتجهة لعناصر البيانات. البحث عن المتجهات هي عملية الاستعلام عن مجموعة من التضمينات للعثور على أكثرها تشابهًا (الأقرب) مع متجه الاستعلام، وغالبًا ما تستخدم خوارزميات أقرب جار تقريبي (ANN) لتحقيق الكفاءة. قواعد بيانات المتجهات (مثل Pinecone أو Milvus) هي قواعد بيانات متخصصة مُحسّنة لتخزين وفهرسة وإجراء عمليات بحث سريعة عن المتجهات على كميات كبيرة من التضمينات.

توفر التضمينات طريقة قوية لتمثيل البيانات لنماذج التعلم الآلي، مما يمكّنها من فهم أوجه التشابه الدلالي والأنماط المعقدة في أنواع البيانات المتنوعة، من النصوص إلى الصور. إنها تقنية أساسية تقود التطورات في العديد من تطبيقات الذكاء الاصطناعي وهي جزء لا يتجزأ من قدرات أطر التعلم الآلي الحديثة مثل PyTorch و TensorFlow.

قراءة الكل
OSZAR »