📚 معلومات الصفحة
الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1
الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم
نوع المحتوى: example
مستوى الصعوبة: متوسط
📝 ملخص الصفحة
تقدم هذه الصفحة تطبيقًا عمليًا لأداة TSNEVisualizer من مكتبة yellowbrick لتصوير البيانات بصريًا في بعدين باستخدام خوارزمية t-SNE. يتم استخدام هذه الأداة لتصوير العناقيد في البيانات النصية، حيث تم تطبيقها على مجموعة بيانات تحتوي على 1085 وثيقة تمثل 10 فئات حيوانية مختلفة.
يوضح الشكل 4.18 الناتج من التصوير أن الفئات الحيوانية المختلفة تظهر مختلطة مع بعضها البعض دون تمييز واضح أو عناقيد منفصلة، مما يشير إلى أن مجرد تسطيح بيانات الصورة الأصلية قد لا يؤدي إلى نتائج ذات جودة عالية في التجميع.
بعد هذا التصوير التمهيدي، تنتقل الصفحة إلى استخدام خوارزمية التجميع التكتلي (Agglomerative Clustering) التي سبق استخدامها في الدرس الثاني من الوحدة الثالثة، بهدف تجميع البيانات في متغير X_norm وعرض الرسم الشجري لمجموعة البيانات.
يتم في المقطع البرمجي استيراد الأدوات المطلوبة وتنفيذ خطوات التصوير، مع ملاحظة أن النتائج الأولية تشير إلى حاجة لأساليب أكثر تقدمًا لتحسين جودة التجميع وفصل الفئات بشكل أوضح.
📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
نوع: محتوى تعليمي
يمكن الآن تصوير البيانات بصريًا باستخدام أداة TSNEVisualizer المألوفة من مكتبة yellowbrick، وتم استخدام هذه الأداة أيضًا في الدرس الثاني من الوحدة الثالثة؛ لتصوير العناقيد بصريًا في البيانات النصية.
نوع: محتوى تعليمي
%capture
!pip install yellowbrick
from yellowbrick.text import TSNEVisualizer
نوع: محتوى تعليمي
tsne = TSNEVisualizer(colors = color_palette) # initializes the tool
tsne.fit(X_norm, y) # uses TSNE to reduce the data to 2 dimensions
tsne.show();
نوع: FIGURE_REFERENCE
شكل 4.18: تصوير العناقيد
نوع: محتوى تعليمي
التصوير التمهيدي هذا ليس كما هو متوقع، فيبدو أن فئات الحيوانات المختلفة مختلطة ببعضها، دون تمييز واضح بينها ودون عناقيد واضحة لها. ويدل ذلك على أن مجرد القيام بتسطيح بيانات الصورة الأصلية من المحتمل ألا يؤدي إلى نتائج ذات جودة عالية. بعد ذلك، ستستخدم خوارزمية التجميع التكتلي (Agglomerative Clustering) نفسها التي استخدمت في الدرس الثاني من الوحدة الثالثة؛ لتجميع البيانات في متغير X_norm، ويستورد المقطع البرمجي التالي مجموعة الأدوات المطلوبة، ويصور الرسم الشجري لمجموعة البيانات:
نوع: METADATA
وزارة التعليم
Ministry of Education
225
2025 - 1447
🔍 عناصر مرئية
TSNE Projection of 1085 Documents
A 2D scatter plot generated by t-SNE (t-Distributed Stochastic Neighbor Embedding) showing the projection of 1085 documents into a 2-dimensional space. Each point represents a document, and its color corresponds to one of ten animal categories. The visualization aims to show clusters, but the text notes that the categories appear mixed, indicating that simple flattening of the original image data might not yield high-quality results.
📄 النص الكامل للصفحة
يمكن الآن تصوير البيانات بصريًا باستخدام أداة TSNEVisualizer المألوفة من مكتبة yellowbrick، وتم استخدام هذه الأداة أيضًا في الدرس الثاني من الوحدة الثالثة؛ لتصوير العناقيد بصريًا في البيانات النصية.%capture
!pip install yellowbrick from yellowbrick.text import TSNEVisualizer tsne = TSNEVisualizer(colors = color_palette) # initializes the tool tsne.fit(X_norm, y) # uses TSNE to reduce the data to 2 dimensions tsne.show();شكل 4.18: تصوير العناقيد التصوير التمهيدي هذا ليس كما هو متوقع، فيبدو أن فئات الحيوانات المختلفة مختلطة ببعضها، دون تمييز واضح بينها ودون عناقيد واضحة لها. ويدل ذلك على أن مجرد القيام بتسطيح بيانات الصورة الأصلية من المحتمل ألا يؤدي إلى نتائج ذات جودة عالية. بعد ذلك، ستستخدم خوارزمية التجميع التكتلي (Agglomerative Clustering) نفسها التي استخدمت في الدرس الثاني من الوحدة الثالثة؛ لتجميع البيانات في متغير X_norm، ويستورد المقطع البرمجي التالي مجموعة الأدوات المطلوبة، ويصور الرسم الشجري لمجموعة البيانات:2025 - 1447--- VISUAL CONTEXT ---
**DIAGRAM**: TSNE Projection of 1085 Documents Description: A 2D scatter plot generated by t-SNE (t-Distributed Stochastic Neighbor Embedding) showing the projection of 1085 documents into a 2-dimensional space. Each point represents a document, and its color corresponds to one of ten animal categories. The visualization aims to show clusters, but the text notes that the categories appear mixed, indicating that simple flattening of the original image data might not yield high-quality results.
X-axis: Dimension 1
Y-axis: Dimension 2
Data: The plot displays a dense collection of colored points. The legend indicates 10 distinct categories: Bear (blue), Cat (green), Chicken (red), Deer (yellow), Duck (light green), Eagle (purple), Lion (orange), Pigeon (pink), Rabbit (black), and Wolf (dark red/maroon). The points from different categories are largely intermingled across the 2D space, with no clear, distinct clusters for each animal type, as noted in the accompanying text. This suggests a lack of clear separation between the categories in the reduced 2D space.
Key Values: 1085 documents, 10 animal categories Context: This visualization demonstrates the application of t-SNE for dimensionality reduction and clustering. It highlights that while t-SNE can project high-dimensional data into 2D, the resulting clusters may not always be distinct, especially if the underlying data (e.g., flattened image data) is not well-suited for clear separation. It sets the stage for introducing more advanced clustering algorithms like Agglomerative Clustering.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هي الأداة المستخدمة في هذه الصفحة لتصوير البيانات بصريًا؟
الإجابة: الأداة المستخدمة هي TSNEVisualizer من مكتبة yellowbrick.
الشرح: الفقرة الأولى تذكر بوضوح استخدام أداة TSNEVisualizer من مكتبة yellowbrick لتصوير البيانات بصريًا.
تلميح: ابحث عن اسم الأداة التي تساعد في رؤية البيانات في أبعاد أقل.
ما هو الهدف من استخدام TSNEVisualizer في هذا السياق؟
الإجابة: الهدف هو تصوير العناقيد بصريًا في البيانات النصية، وتحديداً في هذا المثال، تصوير فئات الحيوانات.
الشرح: تم استخدام TSNEVisualizer لتصوير العناقيد بصريًا، وهو ما يساعد في فهم العلاقات والتجمعات داخل البيانات.
تلميح: ما الذي تسعى الأداة إلى إظهاره من خلال عرض البيانات؟
ما هي النتيجة الأولية لتصوير العناقيد باستخدام TSNEVisualizer كما هو موضح في شكل 4.18؟
الإجابة: النتيجة الأولية لم تكن كما هو متوقع؛ حيث بدت فئات الحيوانات المختلفة مختلطة ببعضها دون تمييز واضح أو عناقيد منفصلة.
الشرح: يشير النص بوضوح إلى أن التصوير الأولي لم يظهر فصلًا واضحًا بين فئات الحيوانات، مما يدل على اختلاطها.
تلميح: ارجع إلى وصف الشكل 4.18 وما ذكره النص عن شكل التوزيع.
ماذا يشير الاختلاط وعدم وضوح العناقيد في التصوير التمهيدي؟
الإجابة: يشير ذلك إلى أن مجرد تسطيح بيانات الصورة الأصلية قد لا يؤدي إلى نتائج ذات جودة عالية أو فصل واضح بين الفئات.
الشرح: النص يفسر عدم وضوح العناقيد كدليل على أن طريقة معالجة البيانات الأولية (تسطيح بيانات الصورة) قد لا تكون كافية لتحقيق فصل جيد.
تلميح: ما هو الاستنتاج الذي يمكن استخلاصه من عدم نجاح التصوير الأولي في فصل الفئات؟
ما هي الخوارزمية التي سيتم استخدامها لاحقًا في هذه الصفحة لمعالجة مشكلة عدم وضوح العناقيد؟
الإجابة: سيتم استخدام خوارزمية التجميع التكتلي (Agglomerative Clustering).
الشرح: النص يوضح أن خوارزمية Agglomerative Clustering ستُستخدم بعد ذلك لتجميع البيانات، مما يشير إلى أنها ستكون بديلاً أو مكملاً للطرق السابقة.
تلميح: ما هي الخطوة التالية المقترحة بعد فشل التصوير الأولي لتحسين التجميع؟