📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
دالة Build_graph() fx
نوع: محتوى تعليمي
دالة Build_graph() fx
نوع: محتوى تعليمي
تُستخدم دالة ()Build_graph لإنشاء مخطط يتضمن:
• عقدة واحدة لكل كلمة ضمن مفردات محددة.
• حافة بين كل كلمتين. الوزن على الحافة يساوي التشابه الدلالي بين الكلمات، المحسوب بواسطة أداة Doc2Vec وهي أداة معالجة اللغات الطبيعية المخصصة لتمثيل النص كمتجه وهي تعميم لنهجية نموذج الكلمة إلى المتجه (Word2Vec).
ترسم الدالة مخططًا ذا عقدة واحدة لكل كلمة في المفردات المحددة. توجد كذلك حافة بين عقدتين إذا كان تشابه نموذج الكلمة إلى المتجه (Word2Vec) أكبر من الحد المعطى.
Python Code Example
نوع: محتوى تعليمي
# tool used to create combinations (e.g. pairs, triplets) of the elements in a list
from itertools import combinations
import networkx as nx # python library for processing graphs
def build_graph(vocab:set, # set of unique words
model_wv # Word2Vec model
):
# gets all possible pairs of words in the doc
pairs=combinations(vocab,2)
G=nx.Graph() # makes a new graph
for w1,w2 in pairs: # for every pair of words w1, w2
sim=model_wv.similarity(w1, w2) # gets the similarity between the two words
G.add_edge(w1,w2,weight=sim)
return G
# creates a graph for the vocabulary of the World Cup document
G=build_graph(vocab,model_wv)
# prints the weight of the edge (semantic similarity) between the two words
G['referee']['goalkeeper']
نوع: محتوى تعليمي
{'weight': 0.40646762}
نوع: محتوى تعليمي
وبالنظر إلى ذلك المخطط المبني على الكلمة، يمكن تمثيل مجموعة من الكلمات المتشابهة دلاليًا في صورة عناقيد من العقد المتصلة معًا بواسطة حواف عالية الوزن. يُطلق على عناقيد العقد كذلك المجتمعات (Communities). مُخرج المخطط هو مجموعة بسيطة من الرؤوس والحواف الموزونة. لم تُجرَ عملية التجميع حتى الآن لإنشاء المجتمعات. في الشكل 3.28 تُستخدم ألوان مختلفة لتمييز المجتمعات في المخطط المذكور بالمثال السابق.
شكل 3.28: المجتمعات في المخطط
نوع: FIGURE_REFERENCE
شكل 3.28: المجتمعات في المخطط
نوع: METADATA
178
نوع: METADATA
وزارة التعليم
Ministry of Education
2023 - 1447
🔍 عناصر مرئية
شكل 3.28: المجتمعات في المخطط
A network graph showing interconnected nodes (words) clustered into different communities, represented by various colors (green, yellow, red, blue, purple). The nodes are connected by edges, implying semantic similarity. Different colored clusters indicate distinct communities within the graph. The graph has a central dense cluster with several smaller, more peripheral clusters connected to it.
وزارة التعليم
The logo of the Ministry of Education, featuring Arabic text 'وزارة التعليم' and English text 'Ministry of Education' along with the years '2023 - 1447'. The text is in a light green/teal color.
📄 النص الكامل للصفحة
دالة Build_graph() fxتُستخدم دالة ()Build_graph لإنشاء مخطط يتضمن:
• عقدة واحدة لكل كلمة ضمن مفردات محددة.
• حافة بين كل كلمتين. الوزن على الحافة يساوي التشابه الدلالي بين الكلمات، المحسوب بواسطة أداة Doc2Vec وهي أداة معالجة اللغات الطبيعية المخصصة لتمثيل النص كمتجه وهي تعميم لنهجية نموذج الكلمة إلى المتجه (Word2Vec).
ترسم الدالة مخططًا ذا عقدة واحدة لكل كلمة في المفردات المحددة. توجد كذلك حافة بين عقدتين إذا كان تشابه نموذج الكلمة إلى المتجه (Word2Vec) أكبر من الحد المعطى.--- SECTION: Python Code Example ---
# tool used to create combinations (e.g. pairs, triplets) of the elements in a list from itertools import combinations import networkx as nx # python library for processing graphs def build_graph(vocab:set, # set of unique words model_wv # Word2Vec model
):
# gets all possible pairs of words in the doc pairs=combinations(vocab,2)G=nx.Graph() # makes a new graph for w1,w2 in pairs: # for every pair of words w1, w2
sim=model_wv.similarity(w1, w2) # gets the similarity between the two words G.add_edge(w1,w2,weight=sim)return G# creates a graph for the vocabulary of the World Cup document G=build_graph(vocab,model_wv)
# prints the weight of the edge (semantic similarity) between the two words G['referee']['goalkeeper']{'weight': 0.40646762}وبالنظر إلى ذلك المخطط المبني على الكلمة، يمكن تمثيل مجموعة من الكلمات المتشابهة دلاليًا في صورة عناقيد من العقد المتصلة معًا بواسطة حواف عالية الوزن. يُطلق على عناقيد العقد كذلك المجتمعات (Communities). مُخرج المخطط هو مجموعة بسيطة من الرؤوس والحواف الموزونة. لم تُجرَ عملية التجميع حتى الآن لإنشاء المجتمعات. في الشكل 3.28 تُستخدم ألوان مختلفة لتمييز المجتمعات في المخطط المذكور بالمثال السابق.--- SECTION: شكل 3.28: المجتمعات في المخطط --- شكل 3.28: المجتمعات في المخطط2023 - 1447--- VISUAL CONTEXT ---
**DIAGRAM**: شكل 3.28: المجتمعات في المخطط
Description: A network graph showing interconnected nodes (words) clustered into different communities, represented by various colors (green, yellow, red, blue, purple). The nodes are connected by edges, implying semantic similarity. Different colored clusters indicate distinct communities within the graph. The graph has a central dense cluster with several smaller, more peripheral clusters connected to it.
Context: This diagram visually represents the output of the `Build_graph` function, illustrating how words are grouped into 'communities' based on their semantic similarity, as described in the accompanying text. The colors help distinguish these communities.Context: This is a standard footer element indicating the publisher or endorsing body of the textbook.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هي الوظيفة الأساسية للدالة `Build_graph()` في معالجة النصوص؟
الإجابة: تُستخدم الدالة `Build_graph()` لإنشاء مخطط (graph) حيث تمثل كل كلمة ضمن مفردات محددة عقدة (node)، وتُمثل الحواف (edges) بين الكلمات التشابه الدلالي بينها، والذي يتم حسابه عادةً بواسطة أدوات مثل Doc2Vec.
الشرح: الدالة `Build_graph()` تبني تمثيلاً مرئياً للعلاقات الدلالية بين الكلمات، مما يسهل فهم تكتلها وارتباطاتها.
تلميح: فكر في الهدف الرئيسي من تمثيل الكلمات والعلاقات بينها في هيكل بياني.
كيف يتم حساب الوزن على الحواف في المخطط الذي تنشئه الدالة `Build_graph()`؟
الإجابة: يتم حساب الوزن على الحواف في المخطط الذي تنشئه الدالة `Build_graph()` ليمثل التشابه الدلالي بين الكلمتين. يستخدم لهذا الغرض أداة Doc2Vec، وهي أداة معالجة لغات طبيعية لتمثيل النص كمتجه، وهي تعميم لنموذج Word2Vec.
الشرح: تحديد الوزن على الحواف بناءً على التشابه الدلالي يساعد في إبراز الكلمات الأكثر ارتباطًا ببعضها البعض.
تلميح: ما هي الأداة أو التقنية المستخدمة لتقدير مدى تشابه كلمتين؟
ما هو الشرط الذي يجعل هناك حافة بين عقدتين (كلمتين) في المخطط الذي تنشئه الدالة `Build_graph()`؟
الإجابة: توجد حافة بين عقدتين (كلمتين) إذا كان تشابه نموذج الكلمة إلى المتجه (Word2Vec) بين هاتين الكلمتين أكبر من حد معين تم تحديده مسبقًا.
الشرح: تحديد حد أدنى للتشابه الدلالي يضمن أن الحواف تمثل علاقات قوية وذات مغزى بين الكلمات.
تلميح: متى تقرر الدالة رسم خط (حافة) يربط بين كلمتين؟
ماذا يُطلق على مجموعات العقد المتصلة معًا بواسطة حواف عالية الوزن في المخطط، والتي تمثل مجموعات من الكلمات المتشابهة دلاليًا؟
الإجابة: يُطلق على عناقيد العقد، التي تمثل مجموعات من الكلمات المتشابهة دلاليًا والمتصلة بحواف عالية الوزن، اسم "المجتمعات" (Communities).
الشرح: المجتمعات تساعد في فهم البنية الأوسع للبيانات النصية وتحديد المواضيع الرئيسية أو المفاهيم المرتبطة.
تلميح: هذه المجموعات المتكتلة من الكلمات المتشابهة لها مصطلح خاص في نظرية المخططات.
ما هو شكل المخرج النهائي لدالة `Build_graph()` قبل إجراء عملية التجميع؟
الإجابة: قبل إجراء عملية التجميع لإنشاء المجتمعات، يكون المخرج النهائي لدالة `Build_graph()` هو مجموعة بسيطة من الرؤوس (العقد) والحواف الموزونة.
الشرح: التفريق بين المخرج الأولي (المخطط) والنتائج بعد التجميع (المجتمعات) مهم لفهم خطوات عملية تحليل المخطط.
تلميح: صف الهيكل الأساسي الذي تمثله الدالة قبل تنظيم العناصر في مجموعات.