📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
نوع: محتوى تعليمي
from sklearn.metrics import homogeneity_score, adjusted_rand_score, completeness_score
print('\nHomogeneity score:', homogeneity_score(y, pred))
print('\nAdjusted Rand score:', adjusted_rand_score(y, pred))
print('\nCompleteness score:', completeness_score(y, pred))
نوع: محتوى تعليمي
Homogeneity score: 0.09868725008128477
Adjusted Rand score: 0.038254515908926826
Completeness score: 0.101897123096584
نوع: محتوى تعليمي
كما سبق توضيحه بالتفصيل في الدرس الثاني من الوحدة الثالثة، فإن مؤشري التجانس والاكتمال يأخذان قيماً بين 0 و 1، وترتفع قيمة مؤشر التجانس إلى أقصى حد عندما يكون لجميع نقاط العنقود الواحد العنوان الحقيقي الأساسي نفسه. كما ترتفع قيمة مؤشر الاكتمال إلى الحد الأقصى عندما تنتمي جميع نقاط البيانات التي تحمل العنوان الحقيقي الأساسي نفسه إلى العنقود نفسه. وأخيراً يأخذ مؤشر راند المعدل قيماً بين 0.5- و 1.0، وترتفع إلى الحد الأقصى عندما تكون جميع نقاط البيانات التي لها العنوان نفسه في العنقود نفسه. وتكون جميع النقاط ذات العناوين المختلفة في عناقيد متباينة. وكما هو متوقع تفشل الخوارزمية بعد تصوير البيانات في العثور على عناقيد عالية الجودة تتطابق مع فئات الحيوانات الفعلية؛ حيث أن قيم المؤشرات الثلاث منخفضة للغاية. وعلى الرغم من أن مجرد القيام بتسطيح البيانات كان كافياً للحصول على نتائج معقولة لتصنيف الصور، إلا أن تجميع الصور في عناقيد يمثل مشكلة أكثر صعوبة.
Clustering with Feature Selection
نوع: محتوى تعليمي
Clustering with Feature Selection التجميع بانتقاء الخصائص
نوع: محتوى تعليمي
في الدرس السابق تم توضيح أن استخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) لتحويل بيانات الصور إلى صيغة أكثر دلالة يؤدي إلى إنجاز أعلى بشكل ملحوظ في تصنيف الصور، وسيطبق التحويل نفسه لاختبار ما إذا كان بإمكانه أيضاً تحسين نتائج مهام تجميع الصور.
نوع: محتوى تعليمي
from skimage.color import rgb2gray
from skimage.feature import hog
# converts the list of resized images to an array of grayscale images
X_gray = np.array([rgb2gray(img) for img in resized_images])
# computes the HOG features for each grayscale image in the array
X_hog = np.array([hog(img) for img in X_gray])
X_hog.shape
نوع: محتوى تعليمي
(1085, 54756)
نوع: محتوى تعليمي
يكشف شكل البيانات المحولة أن كل صورة تمثل الآن على هيئة متجهة بقيمة عددية هي: أربعة وخمسون ألفاً وسبعمئة وستة وخمسون (54,756).
نوع: محتوى تعليمي
يستخدم المقطع البرمجي التالي أداة TSNEVisualizer لتصوير هذا التنسيق الجديد:
نوع: محتوى تعليمي
tsne = TSNEVisualizer(colors = color_palette)
tsne.fit(X_hog, y)
tsne.show();
نوع: METADATA
وزارة التعليم
227
2023 - 1447
📄 النص الكامل للصفحة
from sklearn.metrics import homogeneity_score, adjusted_rand_score, completeness_score print('\nHomogeneity score:', homogeneity_score(y, pred))
print('\nAdjusted Rand score:', adjusted_rand_score(y, pred))
print('\nCompleteness score:', completeness_score(y, pred))Homogeneity score: 0.09868725008128477
Adjusted Rand score: 0.038254515908926826
Completeness score: 0.101897123096584كما سبق توضيحه بالتفصيل في الدرس الثاني من الوحدة الثالثة، فإن مؤشري التجانس والاكتمال يأخذان قيماً بين 0 و 1، وترتفع قيمة مؤشر التجانس إلى أقصى حد عندما يكون لجميع نقاط العنقود الواحد العنوان الحقيقي الأساسي نفسه. كما ترتفع قيمة مؤشر الاكتمال إلى الحد الأقصى عندما تنتمي جميع نقاط البيانات التي تحمل العنوان الحقيقي الأساسي نفسه إلى العنقود نفسه. وأخيراً يأخذ مؤشر راند المعدل قيماً بين 0.5- و 1.0، وترتفع إلى الحد الأقصى عندما تكون جميع نقاط البيانات التي لها العنوان نفسه في العنقود نفسه. وتكون جميع النقاط ذات العناوين المختلفة في عناقيد متباينة. وكما هو متوقع تفشل الخوارزمية بعد تصوير البيانات في العثور على عناقيد عالية الجودة تتطابق مع فئات الحيوانات الفعلية؛ حيث أن قيم المؤشرات الثلاث منخفضة للغاية. وعلى الرغم من أن مجرد القيام بتسطيح البيانات كان كافياً للحصول على نتائج معقولة لتصنيف الصور، إلا أن تجميع الصور في عناقيد يمثل مشكلة أكثر صعوبة.--- SECTION: Clustering with Feature Selection ---
Clustering with Feature Selection التجميع بانتقاء الخصائص في الدرس السابق تم توضيح أن استخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) لتحويل بيانات الصور إلى صيغة أكثر دلالة يؤدي إلى إنجاز أعلى بشكل ملحوظ في تصنيف الصور، وسيطبق التحويل نفسه لاختبار ما إذا كان بإمكانه أيضاً تحسين نتائج مهام تجميع الصور.from skimage.color import rgb2gray from skimage.feature import hog
# converts the list of resized images to an array of grayscale images X_gray = np.array([rgb2gray(img) for img in resized_images])
# computes the HOG features for each grayscale image in the array X_hog = np.array([hog(img) for img in X_gray])
X_hog.shape(1085, 54756)يكشف شكل البيانات المحولة أن كل صورة تمثل الآن على هيئة متجهة بقيمة عددية هي: أربعة وخمسون ألفاً وسبعمئة وستة وخمسون (54,756).يستخدم المقطع البرمجي التالي أداة TSNEVisualizer لتصوير هذا التنسيق الجديد:tsne = TSNEVisualizer(colors = color_palette)
tsne.fit(X_hog, y)
tsne.show();2023 - 1447
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ماذا تقيس مؤشرات التجانس (Homogeneity score) والاكتمال (Completeness score) عند تقييم خوارزميات التجميع؟
الإجابة: يقيس مؤشر التجانس ما إذا كانت العناقيد تحتوي فقط على نقاط بيانات تنتمي إلى فئة واحدة، بينما يقيس مؤشر الاكتمال ما إذا كانت جميع نقاط البيانات التي تنتمي إلى فئة معينة قد تم تجميعها في نفس العنقود.
الشرح: التجانس يركز على أن كل عنقود يجب أن يحتوي على نقاط من فئة واحدة، بينما الاكتمال يركز على أن نقاط الفئة الواحدة يجب أن تكون مجتمعة في عنقود واحد. القيم الأعلى تعني تطابقاً أفضل مع التصنيف الحقيقي.
تلميح: فكر في مدى 'نقاء' العنقود ومدى 'شموله' للفئات.
لماذا تفشل الخوارزمية في العثور على عناقيد عالية الجودة تتطابق مع فئات الحيوانات الفعلية في المثال المذكور، بناءً على قيم المؤشرات؟
الإجابة: تفشل الخوارزمية لأن قيم مؤشرات التجانس والاكتمال ومؤشر راند المعدل منخفضة للغاية، مما يدل على أن العناقيد التي تم إنشاؤها لا تتطابق بشكل جيد مع التصنيفات الحقيقية للبيانات.
الشرح: القيم المنخفضة لهذه المؤشرات تشير إلى أن العناقيد المكتشفة لا تعكس بدقة الفئات الأصلية للبيانات، مما يعني أن الخوارزمية لم تنجح في فصل البيانات بشكل فعال حسب الفئات.
تلميح: ماذا تعني القيم المنخفضة لهذه المؤشرات عند تقييم جودة التجميع؟
ما هي فائدة استخدام تحويل المخطط التكراري للتدرجات الموجهة (HOG) في سياق تجميع الصور؟
الإجابة: يساعد تحويل HOG على تحويل بيانات الصور إلى صيغة أكثر دلالة، مما قد يحسن نتائج مهام تجميع الصور، حيث يكشف عن ميزات هيكلية أكثر قوة في الصور.
الشرح: HOG يستخرج معلومات حول شكل وحواف الكائنات في الصورة، وهي معلومات قيمة يمكن أن تساعد خوارزميات التجميع على فصل الصور المتشابهة وتجميعها معًا بشكل أفضل.
تلميح: فكر في كيف يمكن للميزات المستخرجة من HOG أن تساعد في تمييز الصور المختلفة عن بعضها البعض.
بعد تطبيق تحويل HOG على بيانات الصور، كم عدد الميزات العددية التي تمثل كل صورة؟
الإجابة: بعد تطبيق تحويل HOG، أصبحت كل صورة تمثل على هيئة متجهة عددية تحتوي على 54,756 ميزة.
الشرح: الشكل (shape) الناتج من عملية الحساب يوضح عدد الصفوف (الصور) وعدد الأعمدة (الميزات لكل صورة). في هذه الحالة، كل صورة تم تمثيلها بـ 54,756 قيمة عددية.
تلميح: ابحث عن الأبعاد النهائية للمصفوفة بعد حساب ميزات HOG.
ما هي العلاقة بين قيم مؤشرات التجانس والاكتمال وجودة التجميع في خوارزميات التجميع؟
الإجابة: ترتفع قيمة مؤشر التجانس إلى أقصى حد عندما يكون لجميع نقاط العنقود الواحد العنوان الحقيقي الأساسي نفسه. وترتفع قيمة مؤشر الاكتمال إلى الحد الأقصى عندما تنتمي جميع نقاط البيانات التي تحمل العنوان الحقيقي الأساسي نفسه إلى العنقود نفسه. والقيم المنخفضة لهذه المؤشرات تشير إلى فشل الخوارزمية في العثور على عناقيد عالية الجودة تتطابق مع الفئات الفعلية.
الشرح: مؤشرا التجانس والاكتمال يقيسان جودة التجميع من حيث مدى تطابق العناقيد مع الفئات الحقيقية. التجانس يقيس نقاء العنقود (نقاط من فئة واحدة)، والاكتمال يقيس شمولية العنقود (جميع نقاط الفئة في عنقود واحد). القيم المنخفضة تشير إلى ضعف الأداء.
تلميح: فكر في معنى كل مؤشر وكيف يرتبط بتطابق نقاط البيانات مع الفئات الحقيقية.
التصنيف: مفهوم جوهري | المستوى: متوسط