دالة Build_graph وتمثيل المجتمعات في المخططات - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

الدرس: إنشاء مخططات الكلمات وتجميعها في مجتمعات دلالية

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: example

الفصل: 3

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

تشرح هذه الصفحة دالة `Build_graph()` المستخدمة في معالجة اللغات الطبيعية لإنشاء مخططات تمثل الكلمات كعقد وتشابهها الدلالي كحواف موزونة. تُستخدم الدالة لمعالجة مفردات محددة، حيث تُنشئ عقدة لكل كلمة وحافة بين كل كلمتين، مع حساب الوزن باستخدام تشابه نموذج Word2Vec أو Doc2Vec.

يُقدم مثال برمجي بلغة Python يوضح كيفية تنفيذ الدالة باستخدام مكتبة NetworkX، حيث تُستورد الكلمات من مجموعة مفردات وتُحسب التشابهات بين أزواج الكلمات لإضافة حواف إلى المخطط. يُظهر المثال تطبيقًا عمليًا على وثيقة عن كأس العالم، مع طباعة وزن الحافة بين كلمتين مثل 'referee' و 'goalkeeper'.

يُشرح كيف يمكن تمثيل الكلمات المتشابهة دلاليًا كمجتمعات (communities) في المخطط، حيث تتجمع العقد المتصلة بحواف عالية الوزن معًا. يُذكر أن عملية التجميع لم تُنفذ بعد في الكود المقدم، لكن الشكل 3.28 يوضح مجتمعات ملونة في مخطط مبني على مثال سابق، مما يساعد في تصور التجميعات الدلالية.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

دالة Build_graph() fx

نوع: محتوى تعليمي

دالة Build_graph() fx

نوع: محتوى تعليمي

تُستخدم دالة ()Build_graph لإنشاء مخطط يتضمن: • عقدة واحدة لكل كلمة ضمن مفردات محددة. • حافة بين كل كلمتين. الوزن على الحافة يساوي التشابه الدلالي بين الكلمات، المحسوب بواسطة أداة Doc2Vec وهي أداة معالجة اللغات الطبيعية المخصصة لتمثيل النص كمتجه وهي تعميم لنهجية نموذج الكلمة إلى المتجه (Word2Vec). ترسم الدالة مخططًا ذا عقدة واحدة لكل كلمة في المفردات المحددة. توجد كذلك حافة بين عقدتين إذا كان تشابه نموذج الكلمة إلى المتجه (Word2Vec) أكبر من الحد المعطى.

Python Code Example

نوع: محتوى تعليمي

# tool used to create combinations (e.g. pairs, triplets) of the elements in a list from itertools import combinations import networkx as nx # python library for processing graphs def build_graph(vocab:set, # set of unique words model_wv # Word2Vec model ): # gets all possible pairs of words in the doc pairs=combinations(vocab,2) G=nx.Graph() # makes a new graph for w1,w2 in pairs: # for every pair of words w1, w2 sim=model_wv.similarity(w1, w2) # gets the similarity between the two words G.add_edge(w1,w2,weight=sim) return G # creates a graph for the vocabulary of the World Cup document G=build_graph(vocab,model_wv) # prints the weight of the edge (semantic similarity) between the two words G['referee']['goalkeeper']

نوع: محتوى تعليمي

{'weight': 0.40646762}

نوع: محتوى تعليمي

وبالنظر إلى ذلك المخطط المبني على الكلمة، يمكن تمثيل مجموعة من الكلمات المتشابهة دلاليًا في صورة عناقيد من العقد المتصلة معًا بواسطة حواف عالية الوزن. يُطلق على عناقيد العقد كذلك المجتمعات (Communities). مُخرج المخطط هو مجموعة بسيطة من الرؤوس والحواف الموزونة. لم تُجرَ عملية التجميع حتى الآن لإنشاء المجتمعات. في الشكل 3.28 تُستخدم ألوان مختلفة لتمييز المجتمعات في المخطط المذكور بالمثال السابق.

شكل 3.28: المجتمعات في المخطط

نوع: FIGURE_REFERENCE

شكل 3.28: المجتمعات في المخطط

نوع: METADATA

178

نوع: METADATA

وزارة التعليم Ministry of Education 2023 - 1447

🔍 عناصر مرئية

شكل 3.28: المجتمعات في المخطط

A network graph showing interconnected nodes (words) clustered into different communities, represented by various colors (green, yellow, red, blue, purple). The nodes are connected by edges, implying semantic similarity. Different colored clusters indicate distinct communities within the graph. The graph has a central dense cluster with several smaller, more peripheral clusters connected to it.

وزارة التعليم

The logo of the Ministry of Education, featuring Arabic text 'وزارة التعليم' and English text 'Ministry of Education' along with the years '2023 - 1447'. The text is in a light green/teal color.

📄 النص الكامل للصفحة

دالة Build_graph() fxتُستخدم دالة ()Build_graph لإنشاء مخطط يتضمن: • عقدة واحدة لكل كلمة ضمن مفردات محددة. • حافة بين كل كلمتين. الوزن على الحافة يساوي التشابه الدلالي بين الكلمات، المحسوب بواسطة أداة Doc2Vec وهي أداة معالجة اللغات الطبيعية المخصصة لتمثيل النص كمتجه وهي تعميم لنهجية نموذج الكلمة إلى المتجه (Word2Vec). ترسم الدالة مخططًا ذا عقدة واحدة لكل كلمة في المفردات المحددة. توجد كذلك حافة بين عقدتين إذا كان تشابه نموذج الكلمة إلى المتجه (Word2Vec) أكبر من الحد المعطى.--- SECTION: Python Code Example --- # tool used to create combinations (e.g. pairs, triplets) of the elements in a list from itertools import combinations import networkx as nx # python library for processing graphs def build_graph(vocab:set, # set of unique words model_wv # Word2Vec model ): # gets all possible pairs of words in the doc pairs=combinations(vocab,2)G=nx.Graph() # makes a new graph for w1,w2 in pairs: # for every pair of words w1, w2 sim=model_wv.similarity(w1, w2) # gets the similarity between the two words G.add_edge(w1,w2,weight=sim)return G# creates a graph for the vocabulary of the World Cup document G=build_graph(vocab,model_wv) # prints the weight of the edge (semantic similarity) between the two words G['referee']['goalkeeper']{'weight': 0.40646762}وبالنظر إلى ذلك المخطط المبني على الكلمة، يمكن تمثيل مجموعة من الكلمات المتشابهة دلاليًا في صورة عناقيد من العقد المتصلة معًا بواسطة حواف عالية الوزن. يُطلق على عناقيد العقد كذلك المجتمعات (Communities). مُخرج المخطط هو مجموعة بسيطة من الرؤوس والحواف الموزونة. لم تُجرَ عملية التجميع حتى الآن لإنشاء المجتمعات. في الشكل 3.28 تُستخدم ألوان مختلفة لتمييز المجتمعات في المخطط المذكور بالمثال السابق.--- SECTION: شكل 3.28: المجتمعات في المخطط --- شكل 3.28: المجتمعات في المخطط2023 - 1447--- VISUAL CONTEXT --- **DIAGRAM**: شكل 3.28: المجتمعات في المخطط Description: A network graph showing interconnected nodes (words) clustered into different communities, represented by various colors (green, yellow, red, blue, purple). The nodes are connected by edges, implying semantic similarity. Different colored clusters indicate distinct communities within the graph. The graph has a central dense cluster with several smaller, more peripheral clusters connected to it. Context: This diagram visually represents the output of the `Build_graph` function, illustrating how words are grouped into 'communities' based on their semantic similarity, as described in the accompanying text. The colors help distinguish these communities.Context: This is a standard footer element indicating the publisher or endorsing body of the textbook.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هي الوظيفة الأساسية للدالة `Build_graph()` في معالجة النصوص؟

الإجابة: تُستخدم الدالة `Build_graph()` لإنشاء مخطط (graph) حيث تمثل كل كلمة ضمن مفردات محددة عقدة (node)، وتُمثل الحواف (edges) بين الكلمات التشابه الدلالي بينها، والذي يتم حسابه عادةً بواسطة أدوات مثل Doc2Vec.

الشرح: الدالة `Build_graph()` تبني تمثيلاً مرئياً للعلاقات الدلالية بين الكلمات، مما يسهل فهم تكتلها وارتباطاتها.

تلميح: فكر في الهدف الرئيسي من تمثيل الكلمات والعلاقات بينها في هيكل بياني.

كيف يتم حساب الوزن على الحواف في المخطط الذي تنشئه الدالة `Build_graph()`؟

الإجابة: يتم حساب الوزن على الحواف في المخطط الذي تنشئه الدالة `Build_graph()` ليمثل التشابه الدلالي بين الكلمتين. يستخدم لهذا الغرض أداة Doc2Vec، وهي أداة معالجة لغات طبيعية لتمثيل النص كمتجه، وهي تعميم لنموذج Word2Vec.

الشرح: تحديد الوزن على الحواف بناءً على التشابه الدلالي يساعد في إبراز الكلمات الأكثر ارتباطًا ببعضها البعض.

تلميح: ما هي الأداة أو التقنية المستخدمة لتقدير مدى تشابه كلمتين؟

ما هو الشرط الذي يجعل هناك حافة بين عقدتين (كلمتين) في المخطط الذي تنشئه الدالة `Build_graph()`؟

الإجابة: توجد حافة بين عقدتين (كلمتين) إذا كان تشابه نموذج الكلمة إلى المتجه (Word2Vec) بين هاتين الكلمتين أكبر من حد معين تم تحديده مسبقًا.

الشرح: تحديد حد أدنى للتشابه الدلالي يضمن أن الحواف تمثل علاقات قوية وذات مغزى بين الكلمات.

تلميح: متى تقرر الدالة رسم خط (حافة) يربط بين كلمتين؟

ماذا يُطلق على مجموعات العقد المتصلة معًا بواسطة حواف عالية الوزن في المخطط، والتي تمثل مجموعات من الكلمات المتشابهة دلاليًا؟

الإجابة: يُطلق على عناقيد العقد، التي تمثل مجموعات من الكلمات المتشابهة دلاليًا والمتصلة بحواف عالية الوزن، اسم "المجتمعات" (Communities).

الشرح: المجتمعات تساعد في فهم البنية الأوسع للبيانات النصية وتحديد المواضيع الرئيسية أو المفاهيم المرتبطة.

تلميح: هذه المجموعات المتكتلة من الكلمات المتشابهة لها مصطلح خاص في نظرية المخططات.

ما هو شكل المخرج النهائي لدالة `Build_graph()` قبل إجراء عملية التجميع؟

الإجابة: قبل إجراء عملية التجميع لإنشاء المجتمعات، يكون المخرج النهائي لدالة `Build_graph()` هو مجموعة بسيطة من الرؤوس (العقد) والحواف الموزونة.

الشرح: التفريق بين المخرج الأولي (المخطط) والنتائج بعد التجميع (المجتمعات) مهم لفهم خطوات عملية تحليل المخطط.

تلميح: صف الهيكل الأساسي الذي تمثله الدالة قبل تنظيم العناصر في مجموعات.