توليد اللغات الطبيعية المبني على الاختيار - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

الدرس: استخدام توليد اللغات الطبيعية المبني على الاختيار

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

يقدم هذا القسم منهجية عملية لتوليد اللغات الطبيعية المبني على الاختيار، والتي تعتمد على اختيار نموذج من الجمل الفرعية من وثيقة محددة. تعتمد المنهجية على استخدام نموذج Word2Vec لتحديد أزواج الكلمات المتشابهة دلالياً، ومكتبة Networkx في لغة البايثون لإنشاء ومعالجة بيانات الشبكة.

يتم في البداية قراءة النص المدخل (مثل مقالة إخبارية) وتقسيمه إلى كلمات باستخدام التعبيرات النمطية، مع تجاهل الكلمات الشائعة والتركيز على الكلمات الموجودة في نموذج Word2Vec. ثم تُنمذج مفردات المستند في مخطط موزون باستخدام مكتبة Networkx، حيث تمثل العقد الكلمات أو المفاهيم، وتمثل الحواف العلاقات بينها مع أوزان تعبر عن قوة هذه العلاقات.

يساعد هذا التمثيل في تحديد العلاقات بين الكلمات وتسهيل اختيار العبارات والجمل ذات الصلة، مما يسمح لنظام توليد اللغات الطبيعية بتحديد المفاهيم الأقوى ارتباطاً واستخدامها في توليد النصوص. يتضمن القسم مثالاً مرئياً لمخطط موزون يوضح العلاقات بين كلمات مثل 'مطعم' و'عشاء' مع أوزان محددة.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

استخدام توليد اللغات الطبيعية المبني على الاختيار

نوع: محتوى تعليمي

استخدام توليد اللغات الطبيعية المبني على الاختيار

Using Selection-Based NLG

نوع: محتوى تعليمي

Using Selection-Based NLG

نوع: محتوى تعليمي

في هذا القسم، سنستعرض منهجية عملية لاختيار نموذج من الجمل الفرعية من وثيقة محددة. هذه المنهجية تجسد استخدام ومزايا توليد اللغات الطبيعية المبني على الاختيار يستند إلى لبنتين رئيسيتين:

نوع: محتوى تعليمي

• نموذج الكلمة إلى المتجه (Word2Vec) المستخدم لتحديد أزواج الكلمات المتشابهة دلالياً.

نوع: محتوى تعليمي

• مكتبة Networkx الشهيرة ضمن لغة البايثون المستخدمة لإنشاء ومعالجة أنواع مختلفة من بيانات الشبكة.

نوع: محتوى تعليمي

• النص المدخل الذي سيستخدم في هذا الفصل هو مقالة إخبارية نُشرت بعد المباراة النهائية لكأس العالم 2022.

نوع: محتوى تعليمي

# reads the input document that we want to summarize with open('article.txt', encoding='utf8', errors='ignore') as f: text=f.read() text[:100] # shows the first 100 characters of the article

نوع: محتوى تعليمي

'It was a consecration, the spiritual overtones entirely appropriate. Lionel Messi not only emulated '

نوع: محتوى تعليمي

في البداية، يُرمز النص باستخدام مكتبة re والتعبير النمطي نفسه المستخدم في الوحدات السابقة:

نوع: محتوى تعليمي

import re #used for regular expressions # tokenize the document, ignore stopwords, focus only on words included in the Word2Vec model. tokenized_doc=[word for word in re.findall(r'\b\w+\b', text.lower()) if word not in stop and word in model_wv] # get the vocabulary (set of unique words). vocab=set(tokenized_doc)

مكتبة Networkx

نوع: محتوى تعليمي

مكتبة Networkx

نوع: محتوى تعليمي

يمكن الآن نمذجة مفردات المستند في مخطط موّزون (Weighted Graph). توفر مكتبة Networkx في لغة البايثون مجموعة واسعة من الأدوات لإنشاء وتحليل المخططات. في توليد اللغات الطبيعية المبني على الاختيار، يساعد تمثيل مفردات الوثيقة في مخطط موّزون في تحديد العلاقات بين الكلمات وتسهيل اختيار العبارات والجمل ذات الصلة. في المخطط الموزون، تمثل كل عقدة كلمة أو مفهوماً، وتمثل الحواف بين العقد العلاقات بين هذه المفاهيم. تُعبر الأوزان على الحواف عن قوة هذه العلاقات، مما يسمح لنظام توليد اللغات الطبيعية بتحديد المفاهيم الأقوى ارتباطاً. عند توليد النصوص، يُستخدم المخطط الموزون للبحث عن العبارات والجمل استناداً إلى العلاقات بين الكلمات. على سبيل المثال، قد يُستخدم النظام المخطط للبحث عن الكلمات والعبارات الأكثر ارتباطاً لوصف كيان محدد ثم استخدام هذه الكلمات لتحديد الجملة الأكثر ملاءمة من قاعدة بيانات النظام.

نوع: METADATA

وزارة التعليم

نوع: METADATA

Ministry of Education

نوع: METADATA

177

نوع: METADATA

2023 - 1447

🔍 عناصر مرئية

شكل 3.27: مثال على مخطط موّزون لـ Networkx

A circular node-link diagram representing a weighted graph. It illustrates relationships between seven concepts or words, with numerical weights on the edges indicating the strength of these relationships.

📄 النص الكامل للصفحة

استخدام توليد اللغات الطبيعية المبني على الاختيار--- SECTION: Using Selection-Based NLG --- Using Selection-Based NLGفي هذا القسم، سنستعرض منهجية عملية لاختيار نموذج من الجمل الفرعية من وثيقة محددة. هذه المنهجية تجسد استخدام ومزايا توليد اللغات الطبيعية المبني على الاختيار يستند إلى لبنتين رئيسيتين:• نموذج الكلمة إلى المتجه (Word2Vec) المستخدم لتحديد أزواج الكلمات المتشابهة دلالياً.• مكتبة Networkx الشهيرة ضمن لغة البايثون المستخدمة لإنشاء ومعالجة أنواع مختلفة من بيانات الشبكة.• النص المدخل الذي سيستخدم في هذا الفصل هو مقالة إخبارية نُشرت بعد المباراة النهائية لكأس العالم 2022.# reads the input document that we want to summarize with open('article.txt', encoding='utf8', errors='ignore') as f: text=f.read()text[:100] # shows the first 100 characters of the article'It was a consecration, the spiritual overtones entirely appropriate. Lionel Messi not only emulated 'في البداية، يُرمز النص باستخدام مكتبة re والتعبير النمطي نفسه المستخدم في الوحدات السابقة:import re #used for regular expressions# tokenize the document, ignore stopwords, focus only on words included in the Word2Vec model. tokenized_doc=[word for word in re.findall(r'\b\w+\b', text.lower()) if word not in stop and word in model_wv]# get the vocabulary (set of unique words). vocab=set(tokenized_doc)--- SECTION: مكتبة Networkx --- مكتبة Networkxيمكن الآن نمذجة مفردات المستند في مخطط موّزون (Weighted Graph). توفر مكتبة Networkx في لغة البايثون مجموعة واسعة من الأدوات لإنشاء وتحليل المخططات. في توليد اللغات الطبيعية المبني على الاختيار، يساعد تمثيل مفردات الوثيقة في مخطط موّزون في تحديد العلاقات بين الكلمات وتسهيل اختيار العبارات والجمل ذات الصلة. في المخطط الموزون، تمثل كل عقدة كلمة أو مفهوماً، وتمثل الحواف بين العقد العلاقات بين هذه المفاهيم. تُعبر الأوزان على الحواف عن قوة هذه العلاقات، مما يسمح لنظام توليد اللغات الطبيعية بتحديد المفاهيم الأقوى ارتباطاً. عند توليد النصوص، يُستخدم المخطط الموزون للبحث عن العبارات والجمل استناداً إلى العلاقات بين الكلمات. على سبيل المثال، قد يُستخدم النظام المخطط للبحث عن الكلمات والعبارات الأكثر ارتباطاً لوصف كيان محدد ثم استخدام هذه الكلمات لتحديد الجملة الأكثر ملاءمة من قاعدة بيانات النظام.2023 - 1447--- VISUAL CONTEXT --- **DIAGRAM**: شكل 3.27: مثال على مخطط موّزون لـ Networkx Description: A circular node-link diagram representing a weighted graph. It illustrates relationships between seven concepts or words, with numerical weights on the edges indicating the strength of these relationships. X-axis: N/A Y-axis: N/A Data: The diagram shows nodes labeled 'مطعم' (restaurant), 'منزل' (home), 'عشاء' (dinner), 'الموقع' (location), 'رائع' (great), 'لذيذ' (delicious), and 'موصى به' (recommended). Edges connect these nodes with associated weights: مطعم-منزل (2), مطعم-عشاء (3), منزل-الموقع (2), عشاء-الموقع (1), عشاء-رائع (2), عشاء-لذيذ (2), موصى به-عشاء (1), موصى به-لذيذ (3). Key Values: مطعم, منزل, عشاء, الموقع, رائع, لذيذ, موصى به, weight 1, weight 2, weight 3 Context: This diagram serves as an example of how the Networkx library can be used to model document vocabulary as a weighted graph. It demonstrates the concept of nodes representing words/concepts and weighted edges representing the strength of their relationships, which is fundamental for selection-based Natural Language Generation.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هي المنهجية التي يتم استعراضها في هذا القسم من كتاب الذكاء الاصطناعي؟

الإجابة: يتم استعراض منهجية عملية لاختيار نموذج من الجمل الفرعية من وثيقة محددة، وهي تجسد استخدام ومزايا توليد اللغات الطبيعية المبني على الاختيار.

الشرح: القسم يبدأ بتوضيح أنه سيستعرض منهجية محددة لتوليد النصوص.

تلميح: ابحث عن وصف الأسلوب أو الطريقة التي يتم تقديمها في بداية القسم.

ما هي اللبناتان الرئيسيتان اللتان تستند إليهما منهجية توليد اللغات الطبيعية المبني على الاختيار؟

الإجابة: تستند المنهجية إلى لبنتين رئيسيتين: نموذج الكلمة إلى المتجه (Word2Vec) لتحديد أزواج الكلمات المتشابهة دلالياً، ومكتبة Networkx لإنشاء ومعالجة بيانات الشبكة.

الشرح: هذه هي الأدوات الأساسية التي تم ذكرها لدعم المنهجية.

تلميح: النص يحدد بوضوح نقطتين أساسيتين كـ "لبنتين رئيسيتين".

كيف يتم استخدام مكتبة Networkx في توليد اللغات الطبيعية المبني على الاختيار؟

الإجابة: تُستخدم مكتبة Networkx لنمذجة مفردات المستند في مخطط موّزون (Weighted Graph)، حيث تمثل كل عقدة كلمة أو مفهوماً، وتمثل الحواف العلاقات بينها بأوزان تشير إلى قوة هذه العلاقات، مما يسهل تحديد المفاهيم والعلاقات الأقوى ارتباطاً.

الشرح: النص يشرح أن Networkx تُستخدم لبناء مخطط يصور العلاقات بين الكلمات، وهو أمر حيوي لتحديد الارتباطات.

تلميح: فكر في كيفية تمثيل الكلمات والعلاقات بينها باستخدام هذه المكتبة.

ماذا تمثل العقد والأوزان في المخطط الموزون المستخدم في Networkx لتوليد اللغات الطبيعية؟

الإجابة: تمثل العقد كلمات أو مفاهيم، بينما تمثل الأوزان على الحواف قوة العلاقات بين هذه الكلمات أو المفاهيم.

الشرح: هذا السؤال يركز على فهم المكونات الأساسية لتمثيل البيانات في المخطط الموزون.

تلميح: ارجع إلى وصف عناصر المخطط الموزون في النص.

ما هو الهدف من استخدام نموذج Word2Vec في منهجية توليد اللغات الطبيعية المبني على الاختيار؟

الإجابة: يُستخدم نموذج Word2Vec لتحديد أزواج الكلمات المتشابهة دلالياً، مما يساعد في فهم العلاقات المعنوية بين الكلمات وتحسين عملية اختيار الجمل الفرعية ذات الصلة.

الشرح: Word2Vec هو تقنية لتمثيل الكلمات في مساحة متجهة، مما يسمح بقياس التشابه الدلالي بينها.

تلميح: ابحث عن الدور الذي يلعبه Word2Vec في فهم الكلمات.