تطبيق نموذج العبارات على تحليل المشاعر - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: example

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

تشرح هذه الصفحة كيفية تطبيق نموذج العبارات (phrase model) في معالجة اللغة الطبيعية لتحليل المشاعر. يوضح النص مثالاً عملياً باستخدام مجموعة بيانات IMDB حيث يتم تقسيم الجمل إلى عبارات متعددة الكلمات مثل 'too_long' و'fell_asleep' و'2_hours'، والتي تحمل معلومات أكثر دقة من الكلمات المفردة.

يتم عرض دالة برمجية `annotate_phrases` التي تستخدم نموذج العبارات لتفسير النصوص من خلال تقسيم الوثائق إلى جمل ثم استخراج العبارات المهمة. تُظهر الأمثلة كيف أن العبارات المركبة تعبر عن مشاعر أو سياقات أكثر وضوحاً من مكوناتها الفردية، مثل عبارة 'too_long' التي تحمل دلالة سلبية واضحة رغم أن كلمتي 'too' و'long' منفردتين لا تعبران عن ذلك.

يحتوي المحتوى على رسم توضيحي (شكل 3.12) يظهر عملية تحليل المشاعر قبل التقسيم وبعده، حيث يتم تقسيم العبارات المركبة إلى كلمات مفردة وتحديد تصنيفها العاطفي أو السياقي. يوضح الرسم ثلاثة أمثلة رئيسية مع تصنيفاتها: 'too_long' (سلبي)، 'fell_asleep' (سلبي)، و'2_hours' (السياق المحدد).

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

عند تطبيقها على الجملتين المقسمتين بالمثال الموضح بالأعلى، سيحقق نموذج العبارة النتائج التالية:

نوع: محتوى تعليمي

imdb_phrase_model[tokenized_sentences[0]]

نوع: محتوى تعليمي

['the', 'movie', 'was', 'too_long']

نوع: محتوى تعليمي

imdb_phrase_model[tokenized_sentences[1]]

نوع: محتوى تعليمي

['i', 'fell_asleep', 'after', 'the', 'first', '2_hours']

نوع: محتوى تعليمي

يحدد نموذج العبارة ثلاثة عبارات على النحو التالي: fell_asleep (سقط نائمًا)، وtoo_long (طويل جدًّا)، و2_hours (2-ساعة) وجميعها تحمل معلومات أكثر من كلماتها المفردة.

نوع: محتوى تعليمي

على سبيل المثال، تحمل عبارة too_long (طويل جدًّا) مشاعر سلبية واضحة، على الرغم من أن كلمتي too (جدًّا) وlong (طويل) لا تعبران عن ذلك منفردتين. وبالمثل، فعلى الرغم من أن كلمة asleep (نائم) في مراجعة الفيلم تمثل دلالة سلبية، فالعبارة fell_asleep (سقط نائمًا) توصل رسالة أكثر وضوحًا. وأخيرًا، تستنبط من 2_hours (2-ساعة) سياقًا أكثر تحديدًا من الكلمتين 2 وhours كل على حدة.

نوع: محتوى تعليمي

تستخدم الدالة التالية إمكانية تحديد العبارات بهذا الشكل لتفسير العبارات في وثيقة معطاة:

نوع: محتوى تعليمي

def annotate_phrases(doc:str, phrase_model):
    sentences=tokenize_doc(doc)# split the document into tokenized sentences.
    tokens=[] # list of all the words and phrases found in the doc
    for sentence in sentences: # for each sentence
        # use the phrase model to get tokens and append them to the list.
        tokens+=phrase_model[sentence]
    return ' '.join(tokens) # join all the tokens together to create a new annotated document.

نوع: محتوى تعليمي

يستخدم المقطع البرمجي التالي دالة annotate_phrases() لتفسير كل من تقييمات التدريب والاختبار من مجموعة بيانات IMDB.

نوع: محتوى تعليمي

# annotate all the test and train reviews.
X_train_text_annotated=[annotate_phrases(doc, imdb_phrase_model) for doc in X_
train_text]
X_test_text_annotated=[annotate_phrases(text, imdb_phrase_model) for text in X_
test_text]

نوع: METADATA

وزارة التعليم
Ministry of Education
2023 - 1447

نوع: METADATA

148

🔍 عناصر مرئية

شكل 3.12: المشاعر الإيجابية والسلبية قبل التقسيم وبعده

A flow diagram illustrating the process of sentiment analysis and phrase segmentation. It shows how compound phrases are broken down into individual words and how their sentiment or context is determined. The diagram presents three examples: 'too_long', 'fell_asleep', and '2_hours', showing their initial classification and then their segmented components with their respective classifications.

📄 النص الكامل للصفحة

عند تطبيقها على الجملتين المقسمتين بالمثال الموضح بالأعلى، سيحقق نموذج العبارة النتائج التالية:imdb_phrase_model[tokenized_sentences[0]]['the', 'movie', 'was', 'too_long']imdb_phrase_model[tokenized_sentences[1]]['i', 'fell_asleep', 'after', 'the', 'first', '2_hours']يحدد نموذج العبارة ثلاثة عبارات على النحو التالي: fell_asleep (سقط نائمًا)، وtoo_long (طويل جدًّا)، و2_hours (2-ساعة) وجميعها تحمل معلومات أكثر من كلماتها المفردة.على سبيل المثال، تحمل عبارة too_long (طويل جدًّا) مشاعر سلبية واضحة، على الرغم من أن كلمتي too (جدًّا) وlong (طويل) لا تعبران عن ذلك منفردتين. وبالمثل، فعلى الرغم من أن كلمة asleep (نائم) في مراجعة الفيلم تمثل دلالة سلبية، فالعبارة fell_asleep (سقط نائمًا) توصل رسالة أكثر وضوحًا. وأخيرًا، تستنبط من 2_hours (2-ساعة) سياقًا أكثر تحديدًا من الكلمتين 2 وhours كل على حدة.تستخدم الدالة التالية إمكانية تحديد العبارات بهذا الشكل لتفسير العبارات في وثيقة معطاة:def annotate_phrases(doc:str, phrase_model):
sentences=tokenize_doc(doc)# split the document into tokenized sentences.
tokens=[] # list of all the words and phrases found in the doc for sentence in sentences: # for each sentence
# use the phrase model to get tokens and append them to the list.
tokens+=phrase_model[sentence]
return ' '.join(tokens) # join all the tokens together to create a new annotated document.يستخدم المقطع البرمجي التالي دالة annotate_phrases() لتفسير كل من تقييمات التدريب والاختبار من مجموعة بيانات IMDB.# annotate all the test and train reviews.
X_train_text_annotated=[annotate_phrases(doc, imdb_phrase_model) for doc in X_
train_text]
X_test_text_annotated=[annotate_phrases(text, imdb_phrase_model) for text in X_
test_text]2023 - 1447--- VISUAL CONTEXT ---
**DIAGRAM**: شكل 3.12: المشاعر الإيجابية والسلبية قبل التقسيم وبعده
Description: A flow diagram illustrating the process of sentiment analysis and phrase segmentation. It shows how compound phrases are broken down into individual words and how their sentiment or context is determined. The diagram presents three examples: 'too_long', 'fell_asleep', and '2_hours', showing their initial classification and then their segmented components with their respective classifications.
Data: The diagram shows three main processing flows:
1. **too_long**: Initially classified as 'سلبي' (negative). It is then 'مقسم' (segmented) into 'long' (محايد - neutral) and 'too' (محايد - neutral).
2. **fell_asleep**: Initially classified as 'سلبي' (negative). It is then 'مقسم' (segmented) into 'asleep' (سلبي - negative) and 'fell' (السياق - context).
3. **2_hours**: Initially classified as 'السياق المحدد' (specific context). It is then 'مقسم' (segmented) into 'hours' (السياق - context) and '2' (السياق - context).
Key Values: too_long (سلبي), long (محايد), too (محايد), fell_asleep (سلبي), asleep (سلبي), fell (السياق), 2_hours (السياق المحدد), hours (السياق), 2 (السياق), مقسم
Context: This diagram visually explains how a phrase model processes and segments phrases to extract more nuanced information, especially regarding sentiment, by breaking down multi-word expressions into their constituent parts and re-evaluating their individual or contextual meaning. It demonstrates the concept of tokenization and sentiment classification in Natural Language Processing.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 4 بطاقة لهذه الصفحة

ما هو مفهوم 'نموذج العبارة' (phrase model) في معالجة اللغة الطبيعية؟

الإجابة: نموذج العبارة هو أداة في معالجة اللغة الطبيعية تعمل على تحديد وتحليل العبارات متعددة الكلمات التي تحمل معنى أكثر من مجموع كلماتها المفردة، مثل 'too_long' أو 'fell_asleep'.

الشرح: يساعد نموذج العبارة على استخلاص دلالات ومعاني أعمق من النصوص من خلال التعرف على العبارات الشائعة أو المتكررة التي قد لا تكون واضحة عند تحليل كل كلمة على حدة.

تلميح: فكر في كيف يمكن لمجموعة من الكلمات أن تعبر عن معنى جديد أو أعمق.

كيف يساعد نموذج العبارة في استخلاص المشاعر من النصوص؟

الإجابة: يساعد نموذج العبارة في استخلاص المشاعر من خلال التعرف على عبارات تحمل مشاعر واضحة، مثل 'too_long' التي تعبر عن مشاعر سلبية، حتى لو كانت الكلمات المفردة ('too' و 'long') محايدة بمفردها.

الشرح: من خلال فهم السياق والمعنى المشترك للعبارات، يمكن لنماذج العبارات تحديد نبرة النص أو الشعور الذي يعبر عنه بشكل أكثر دقة من مجرد تحليل كل كلمة على حدة.

تلميح: تذكر مثال 'too_long' وكيف تم تفسيره بشكل مختلف عن كلماته الفردية.

ما الفرق بين تحليل كلمة مفردة وتفسير عبارة باستخدام نموذج العبارة؟

الإجابة: تحليل كلمة مفردة يعتمد على معنى الكلمة بحد ذاتها، بينما تفسير عبارة باستخدام نموذج العبارة يأخذ في الاعتبار المعنى المركب أو السياقي الذي تنقله مجموعة الكلمات مجتمعة، مما قد يؤدي إلى استنتاج معنى مختلف أو أعمق.

الشرح: تستطيع العبارات أن تختصر معاني معقدة أو تحدد سياقات معينة لا يمكن استيعابها بنفس الوضوح من خلال النظر إلى الكلمات الفردية فقط.

تلميح: فكر في مثال '2_hours' وقارنه بكلمتي '2' و 'hours' منفصلتين.

اذكر مثالاً لعبارة متعددة الكلمات تحمل معنى أكثر من مجموع كلماتها المفردة، مع شرح بسيط.

الإجابة: مثال: 'fell_asleep' (سقط نائمًا). هذه العبارة تنقل معنى أكثر وضوحًا وقوة من مجرد جمع معاني كلمتي 'fell' (سقط) و 'asleep' (نائم) بشكل منفصل، حيث تشير إلى حدث اكتمال النوم.

الشرح: العبارات المتكررة في اللغة غالباً ما تتطور لتصبح وحدات ذات معنى خاص بها، وتتطلب أدوات متخصصة للتعرف عليها وفهم دلالاتها.

تلميح: فكر في كيف تجعل هذه العبارة الموقف أكثر وضوحاً مقارنة بكلمتين منفصلتين.