تقييم جودة التجميع وتحسينه بانتقاء الخصائص - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

الدرس: التجميع بانتقاء الخصائص

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

تتناول هذه الصفحة تقييم أداء خوارزميات تجميع البيانات باستخدام مقاييس مثل مؤشر التجانس ومؤشر الاكتمال ومؤشر راند المعدل، حيث تُظهر النتائج قيماً منخفضة تشير إلى ضعف جودة التجميع في مطابقة الفئات الحقيقية للحيوانات. كما تُناقش الصعوبة في تجميع الصور مقارنة بتصنيفها، على الرغم من أن تسطيح البيانات قد يكون كافياً للتصنيف.

يتم بعد ذلك الانتقال إلى تحسين التجميع من خلال انتقاء الخصائص، باستخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) لتحويل صور الحيوانات إلى تمثيلات رقمية أكثر دلالة، مما يؤدي إلى متجهات ذات أبعاد عالية (54,756) لكل صورة. يُستخدم هذا التحويل لاختبار قدرته على تحسين نتائج التجميع.

يُختتم المحتوى بتطبيق أداة TSNEVisualizer لتصوير البيانات المحولة، بهدف استكشاف تأثير انتقاء الخصائص على تجميع الصور وتحسين الأداء في المهام التحليلية.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

from sklearn.metrics import homogeneity_score, adjusted_rand_score, completeness_score print('\nHomogeneity score:', homogeneity_score(y, pred)) print('\nAdjusted Rand score:', adjusted_rand_score(y, pred)) print('\nCompleteness score:', completeness_score(y, pred))

نوع: محتوى تعليمي

Homogeneity score: 0.09868725008128477 Adjusted Rand score: 0.038254515908926826 Completeness score: 0.101897123096584

نوع: محتوى تعليمي

كما سبق توضيحه بالتفصيل في الدرس الثاني من الوحدة الثالثة، فإن مؤشري التجانس والاكتمال يأخذان قيماً بين 0 و 1، وترتفع قيمة مؤشر التجانس إلى أقصى حد عندما يكون لجميع نقاط العنقود الواحد العنوان الحقيقي الأساسي نفسه. كما ترتفع قيمة مؤشر الاكتمال إلى الحد الأقصى عندما تنتمي جميع نقاط البيانات التي تحمل العنوان الحقيقي الأساسي نفسه إلى العنقود نفسه. وأخيراً يأخذ مؤشر راند المعدل قيماً بين 0.5- و 1.0، وترتفع إلى الحد الأقصى عندما تكون جميع نقاط البيانات التي لها العنوان نفسه في العنقود نفسه. وتكون جميع النقاط ذات العناوين المختلفة في عناقيد متباينة. وكما هو متوقع تفشل الخوارزمية بعد تصوير البيانات في العثور على عناقيد عالية الجودة تتطابق مع فئات الحيوانات الفعلية؛ حيث أن قيم المؤشرات الثلاث منخفضة للغاية. وعلى الرغم من أن مجرد القيام بتسطيح البيانات كان كافياً للحصول على نتائج معقولة لتصنيف الصور، إلا أن تجميع الصور في عناقيد يمثل مشكلة أكثر صعوبة.

Clustering with Feature Selection

نوع: محتوى تعليمي

Clustering with Feature Selection التجميع بانتقاء الخصائص

نوع: محتوى تعليمي

في الدرس السابق تم توضيح أن استخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) لتحويل بيانات الصور إلى صيغة أكثر دلالة يؤدي إلى إنجاز أعلى بشكل ملحوظ في تصنيف الصور، وسيطبق التحويل نفسه لاختبار ما إذا كان بإمكانه أيضاً تحسين نتائج مهام تجميع الصور.

نوع: محتوى تعليمي

from skimage.color import rgb2gray from skimage.feature import hog # converts the list of resized images to an array of grayscale images X_gray = np.array([rgb2gray(img) for img in resized_images]) # computes the HOG features for each grayscale image in the array X_hog = np.array([hog(img) for img in X_gray]) X_hog.shape

نوع: محتوى تعليمي

(1085, 54756)

نوع: محتوى تعليمي

يكشف شكل البيانات المحولة أن كل صورة تمثل الآن على هيئة متجهة بقيمة عددية هي: أربعة وخمسون ألفاً وسبعمئة وستة وخمسون (54,756).

نوع: محتوى تعليمي

يستخدم المقطع البرمجي التالي أداة TSNEVisualizer لتصوير هذا التنسيق الجديد:

نوع: محتوى تعليمي

tsne = TSNEVisualizer(colors = color_palette) tsne.fit(X_hog, y) tsne.show();

نوع: METADATA

وزارة التعليم 227 2023 - 1447

📄 النص الكامل للصفحة

from sklearn.metrics import homogeneity_score, adjusted_rand_score, completeness_score print('\nHomogeneity score:', homogeneity_score(y, pred)) print('\nAdjusted Rand score:', adjusted_rand_score(y, pred)) print('\nCompleteness score:', completeness_score(y, pred))Homogeneity score: 0.09868725008128477 Adjusted Rand score: 0.038254515908926826 Completeness score: 0.101897123096584كما سبق توضيحه بالتفصيل في الدرس الثاني من الوحدة الثالثة، فإن مؤشري التجانس والاكتمال يأخذان قيماً بين 0 و 1، وترتفع قيمة مؤشر التجانس إلى أقصى حد عندما يكون لجميع نقاط العنقود الواحد العنوان الحقيقي الأساسي نفسه. كما ترتفع قيمة مؤشر الاكتمال إلى الحد الأقصى عندما تنتمي جميع نقاط البيانات التي تحمل العنوان الحقيقي الأساسي نفسه إلى العنقود نفسه. وأخيراً يأخذ مؤشر راند المعدل قيماً بين 0.5- و 1.0، وترتفع إلى الحد الأقصى عندما تكون جميع نقاط البيانات التي لها العنوان نفسه في العنقود نفسه. وتكون جميع النقاط ذات العناوين المختلفة في عناقيد متباينة. وكما هو متوقع تفشل الخوارزمية بعد تصوير البيانات في العثور على عناقيد عالية الجودة تتطابق مع فئات الحيوانات الفعلية؛ حيث أن قيم المؤشرات الثلاث منخفضة للغاية. وعلى الرغم من أن مجرد القيام بتسطيح البيانات كان كافياً للحصول على نتائج معقولة لتصنيف الصور، إلا أن تجميع الصور في عناقيد يمثل مشكلة أكثر صعوبة.--- SECTION: Clustering with Feature Selection --- Clustering with Feature Selection التجميع بانتقاء الخصائص في الدرس السابق تم توضيح أن استخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) لتحويل بيانات الصور إلى صيغة أكثر دلالة يؤدي إلى إنجاز أعلى بشكل ملحوظ في تصنيف الصور، وسيطبق التحويل نفسه لاختبار ما إذا كان بإمكانه أيضاً تحسين نتائج مهام تجميع الصور.from skimage.color import rgb2gray from skimage.feature import hog # converts the list of resized images to an array of grayscale images X_gray = np.array([rgb2gray(img) for img in resized_images]) # computes the HOG features for each grayscale image in the array X_hog = np.array([hog(img) for img in X_gray]) X_hog.shape(1085, 54756)يكشف شكل البيانات المحولة أن كل صورة تمثل الآن على هيئة متجهة بقيمة عددية هي: أربعة وخمسون ألفاً وسبعمئة وستة وخمسون (54,756).يستخدم المقطع البرمجي التالي أداة TSNEVisualizer لتصوير هذا التنسيق الجديد:tsne = TSNEVisualizer(colors = color_palette) tsne.fit(X_hog, y) tsne.show();2023 - 1447

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ماذا تقيس مؤشرات التجانس (Homogeneity score) والاكتمال (Completeness score) عند تقييم خوارزميات التجميع؟

الإجابة: يقيس مؤشر التجانس ما إذا كانت العناقيد تحتوي فقط على نقاط بيانات تنتمي إلى فئة واحدة، بينما يقيس مؤشر الاكتمال ما إذا كانت جميع نقاط البيانات التي تنتمي إلى فئة معينة قد تم تجميعها في نفس العنقود.

الشرح: التجانس يركز على أن كل عنقود يجب أن يحتوي على نقاط من فئة واحدة، بينما الاكتمال يركز على أن نقاط الفئة الواحدة يجب أن تكون مجتمعة في عنقود واحد. القيم الأعلى تعني تطابقاً أفضل مع التصنيف الحقيقي.

تلميح: فكر في مدى 'نقاء' العنقود ومدى 'شموله' للفئات.

لماذا تفشل الخوارزمية في العثور على عناقيد عالية الجودة تتطابق مع فئات الحيوانات الفعلية في المثال المذكور، بناءً على قيم المؤشرات؟

الإجابة: تفشل الخوارزمية لأن قيم مؤشرات التجانس والاكتمال ومؤشر راند المعدل منخفضة للغاية، مما يدل على أن العناقيد التي تم إنشاؤها لا تتطابق بشكل جيد مع التصنيفات الحقيقية للبيانات.

الشرح: القيم المنخفضة لهذه المؤشرات تشير إلى أن العناقيد المكتشفة لا تعكس بدقة الفئات الأصلية للبيانات، مما يعني أن الخوارزمية لم تنجح في فصل البيانات بشكل فعال حسب الفئات.

تلميح: ماذا تعني القيم المنخفضة لهذه المؤشرات عند تقييم جودة التجميع؟

ما هي فائدة استخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) في سياق تجميع الصور؟

الإجابة: يساعد تحويل HOG على تحويل بيانات الصور إلى صيغة أكثر دلالة، مما قد يحسن نتائج مهام تجميع الصور، حيث يكشف عن ميزات هيكلية أكثر قوة في الصور.

الشرح: HOG يستخرج معلومات حول شكل وحواف الكائنات في الصورة، وهي معلومات قيمة يمكن أن تساعد خوارزميات التجميع على فصل الصور المتشابهة وتجميعها معًا بشكل أفضل.

تلميح: فكر في كيف يمكن للميزات المستخرجة من HOG أن تساعد في تمييز الصور المختلفة عن بعضها البعض.

بعد تطبيق تحويل HOG على بيانات الصور، كم عدد الميزات العددية التي تمثل كل صورة؟

الإجابة: بعد تطبيق تحويل HOG، أصبحت كل صورة تمثل على هيئة متجهة عددية تحتوي على 54,756 ميزة.

الشرح: الشكل (shape) الناتج من عملية الحساب يوضح عدد الصفوف (الصور) وعدد الأعمدة (الميزات لكل صورة). في هذه الحالة، كل صورة تم تمثيلها بـ 54,756 قيمة عددية.

تلميح: ابحث عن الأبعاد النهائية للمصفوفة بعد حساب ميزات HOG.

ما هي العلاقة بين قيم مؤشرات التجانس والاكتمال وجودة التجميع في خوارزميات التجميع؟

الإجابة: ترتفع قيمة مؤشر التجانس إلى أقصى حد عندما يكون لجميع نقاط العنقود الواحد العنوان الحقيقي الأساسي نفسه. وترتفع قيمة مؤشر الاكتمال إلى الحد الأقصى عندما تنتمي جميع نقاط البيانات التي تحمل العنوان الحقيقي الأساسي نفسه إلى العنقود نفسه. والقيم المنخفضة لهذه المؤشرات تشير إلى فشل الخوارزمية في العثور على عناقيد عالية الجودة تتطابق مع الفئات الفعلية.

الشرح: مؤشرا التجانس والاكتمال يقيسان جودة التجميع من حيث مدى تطابق العناقيد مع الفئات الحقيقية. التجانس يقيس نقاء العنقود (نقاط من فئة واحدة)، والاكتمال يقيس شمولية العنقود (جميع نقاط الفئة في عنقود واحد). القيم المنخفضة تشير إلى ضعف الأداء.

تلميح: فكر في معنى كل مؤشر وكيف يرتبط بتطابق نقاط البيانات مع الفئات الحقيقية.

التصنيف: مفهوم جوهري | المستوى: متوسط