مسرد المصطلحات

التعرف على الكيانات المسماة (NER)

استكشف الرؤى باستخدام ميزة التعرّف على الكيانات المسماة (NER). اكتشف كيف يقوم الذكاء الاصطناعي بتحويل النصوص غير المهيكلة إلى بيانات قابلة للتنفيذ لتطبيقات متنوعة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يُعد التعرف على الكيانات المسماة (NER) مهمة أساسية في معالجة اللغات الطبيعية (NLP) ومكونًا رئيسيًا للذكاء الاصطناعي الحديث (AI). وهي تتضمن تحديد وتصنيف أجزاء محددة من المعلومات - المعروفة باسم "الكيانات المسماة" - تلقائيًا داخل نص غير منظم. وتمثل هذه الكيانات عادةً أشياء من العالم الحقيقي مثل الأشخاص والمؤسسات والمواقع والتواريخ وأسماء المنتجات والقيم النقدية وغيرها. ويتمثل الهدف الأساسي من NER في تحويل النص الخام إلى بيانات منظمة، مما يسهل على الآلات فهمها ومعالجتها واستخراج رؤى قيمة لمختلف حالات استخدام الذكاء الاصطناعي.

كيف يعمل التعرف على الكيانات المسماة

تقوم أنظمة NER بتحليل البنية اللغوية وسياق النص لتحديد موقع الكيانات وتصنيفها. وبينما اعتمدت الأنظمة المبكرة اعتمادًا كبيرًا على القواعد النحوية والقواميس (شكل من أشكال الذكاء الاصطناعي الرمزي)، فإن النُهج الحديثة تستفيد من التعلم الآلي، وخاصة التعلم العميق. نماذج مثل المحولات، التي غالبًا ما توجد على منصات مثل Hugging Face، تتفوق في فهم السياق والأنماط اللغوية الدقيقة، مما يؤدي إلى دقة أعلى. تتضمن العملية بشكل عام تحديد الكيانات المحتملة (الكلمات أو العبارات) باستخدام تقنيات غالبًا ما تتعلق بالترميز ثم تصنيفها إلى فئات محددة مسبقًا (على سبيل المثال، شخص، منظمة، موقع، تاريخ، معلومات). ويعتمد هذا التصنيف على السمات المكتسبة أثناء التدريب على مجموعات بيانات كبيرة غالبًا ما تكون مشروحة خصيصًا لمهام NER.

على سبيل المثال، في جملة "في الرابع من يوليو، زارت سارة جونز برج إيفل أثناء تمثيلها لشركة Acme Corp"، سيحدد نظام NER

  • "4 يوليو" كتاريخ
  • "سارة جونز" كشخص
  • "برج إيفل" كموقع "LOCATION
  • "أكمي كورب" كمنظمة

هذا الناتج المهيكل أكثر فائدة بكثير للمهام النهائية مثل تحليل البيانات أو ملء رسم بياني معرفي من النص الأصلي وحده. يمكنك استكشاف دراسة استقصائية حول تقنيات NER للحصول على رؤى تقنية أعمق.

الملاءمة والتطبيقات

تعد تقنية NER تقنية أساسية تتيح العديد من التطبيقات في مختلف المجالات من خلال هيكلة المعلومات النصية:

  • استخراج المعلومات: سحب التفاصيل الأساسية تلقائيًا من المستندات مثل المقالات الإخبارية أو التقارير أو رسائل البريد الإلكتروني. على سبيل المثال، استخراج أسماء الشركات والألقاب التنفيذية والمواقع من موجزات الأخبار المالية.
  • تصنيف المحتوى والتوصيات: وضع علامات على المقالات أو المنشورات مع الكيانات ذات الصلة لتحسين التنظيم وتشغيل أنظمة التوصيات.
  • دعم العملاء: تحليل ملاحظات العملاء أو تذاكر الدعم لتحديد المنتجات أو المواقع أو المشكلات المحددة المذكورة، مما يتيح توجيه وحل أسرع. تخيل نظاماً يقوم تلقائياً بوضع علامات على رسائل البريد الإلكتروني الخاصة بالدعم التي تشير إلى "iPhone 16" و"متجر نيويورك".
  • الرعاية الصحية: تبسيط إدارة السجلات الطبية من خلال استخراج أسماء المرضى والتشخيصات والأدوية والجرعات من الملاحظات السريرية، والمساهمة في مجالات مثل تحليل الصور الطبية عند دمجها مع التقارير.
  • البحث الدلالي: تحسين محركات البحث لفهم المعنى الكامن وراء الاستعلامات من خلال التعرف على الكيانات داخلها (على سبيل المثال، يتطلب البحث عن "مطاعم بالقرب من متحف اللوفر" تحديد "اللوفر" كموقع). توفر أدوات مثل الذكاء الاصطناعي للغة الطبيعية في السحابة السحابيةGoogle إمكانات البحث الدلالي.
  • التحليل المالي: استخراج أسماء الشركات والقيم النقدية والتواريخ من التقارير المالية لتحليل السوق والنمذجة التنبؤية.
  • الامتثال والأمان: تحديد المعلومات الحساسة، مثل الأسماء أو العناوين في المستندات لضمان خصوصية البيانات والامتثال للوائح مثل اللائحة العامة لحماية البيانات.

يمكن تيسير إدارة دورة حياة تعلّم الآلة لنماذج الإنصاف الضوئي (NER)، بما في ذلك التعليقات التوضيحية للبيانات ونشر النماذج، من خلال منصات مثل Ultralytics HUB.

الاختلافات الرئيسية عن المفاهيم ذات الصلة

وغالبًا ما تُستخدم NER جنبًا إلى جنب مع مهام البرمجة اللغوية العصبية الأخرى ولكن لها تركيزًا مميزًا:

  • تحليل المشاعر: يحدد النبرة العاطفية (إيجابية، سلبية، محايدة) المعبر عنها في النص. تحدد NER ما تتم مناقشته، بينما يحدد تحليل المشاعر كيف يشعر المؤلف حيال ذلك.
  • تلخيص النص: يهدف إلى إنشاء نسخة أقصر من النص مع الحفاظ على المعلومات الأساسية. تستخرج NER إشارات إلى كيانات محددة، وليس نظرة عامة مختصرة للنص بأكمله.
  • اكتشاف الأجسام: مهمة الرؤية الحاسوبية (CV) التي تحدد الأجسام داخل الصور وتحدد موقعها باستخدام المربعات المحدودة. تعمل NER على البيانات النصية فقط، وليس على البيانات المرئية مثل Ultralytics YOLOلمهام الكشف.
  • فهم اللغة الطبيعية (NLU): مجال أوسع نطاقًا يشمل الفهم الشامل لمعنى النص، بما في ذلك التعرف على القصد، واستخراج العلاقات، وحل الإسناد الأساسي. NER هي مهمة فرعية محددة داخل NLU تركز فقط على تحديد الكيانات وتصنيفها.
  • استخراج الكلمات الرئيسية: يحدد المصطلحات أو العبارات المهمة في النص، والتي قد تكون أو لا تكون كيانات مسماة. تبحث NER تحديدًا عن الفئات المحددة مسبقًا مثل الأشخاص والأماكن والمنظمات.

يعد فهم هذه الفروق أمرًا بالغ الأهمية لاختيار تقنية البرمجة اللغوية العصبية المناسبة لمشكلة معينة، كما هو موضح في أدلة مثل خطوات مشروع رؤية الحاسوب (على الرغم من تركيزها على السيرة الذاتية، إلا أن المبادئ تنطبق).

قراءة الكل
OSZAR »