📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
نوع: محتوى تعليمي
صور التدرج الرمادي لها قناة واحدة فقط (بدلاً من قنوات RGB الثلاث)، وقيمة كل بكسل عبارة عن رقم واحد يتراوح من 0 إلى 255، حيث تمثل قيمة البكسل 0 اللون الأسود، بينما تمثل قيمة البكسل 255 اللون الأبيض. على سبيل المثال:
نوع: محتوى تعليمي
resized_images[pos2][0][0]
100
نوع: محتوى تعليمي
وكاختبار إضافي لجودة البيانات، يقوم المقطع البرمجي التالي بحساب تكرار عنوان كل صورة حيوان في مجموعة البيانات:
مثال: حساب تكرار العناصر
نوع: محتوى تعليمي
# used to count the frequency of each element in a list.
from collections import Counter
label_cnt = Counter(labels)
label_cnt
نوع: محتوى تعليمي
هنا يمكنك رؤية القيمة المتطرفة وهي فئة Nat (أو الطبيعة)، وتحتوي على ثمانية عناصر فقط مقارنة بالفئات الأخرى.
ناتج Counter
نوع: محتوى تعليمي
Counter({'Bear': 101,
'Cat': 160,
'Chicken': 100,
'Cow': 104,
'Deer': 103,
'Duck': 103,
'Eagle': 101,
'Elephant': 100,
'Lion': 102,
'Monkey': 100,
'Nat': 8,
'Panda': 119,
'Pigeon': 115,
'Rabbit': 100,
'Sheep': 100,
'Tiger': 114,
'Wolf': 100})
نوع: محتوى تعليمي
تحتوي مجموعة البيانات على صور حيوانات وصور أخرى من الطبيعة؛ وذلك بهدف التعرف على الصور التي تشذ عن صور الحيوانات. يكشف Counter (العداد) عن فئة صغيرة جداً عنوانها Nat (الطبيعة)، وتحتوي على ثماني صور فقط، وعندما نقوم بكشف سريع يتضح لك أن هذه الفئة ذات قيم متطرفة (Outlier) تحتوي على صور لمناظر طبيعية ولا يوجد بها أي وجه لأي حيوان.
نوع: محتوى تعليمي
يقوم المقطع البرمجي التالي بإزالة صورة RGBA وصورة التدرج الرمادي، وكذلك كل الصور التي تنتمي لفئة Nat (الطبيعة) من قوائم أسماء الملفات، والعناوين، والصور التي غير حجمها.
مثال: تصفية البيانات
نوع: محتوى تعليمي
N = len(labels)
resized_images = [resized_images[i] for i in range(N) if i not in violations
and labels[i] != "Nat"]
filenames = [filenames[i] for i in range(N) if i not in violations and
labels[i] != "Nat"]
labels = [labels[i] for i in range(N) if i not in violations and labels[i] !=
"Nat"]
نوع: METADATA
وزارة التعليم
203
Ministry of Education
2023 - 1447
🔍 عناصر مرئية
مثال على الوصول إلى قيمة بكسل
A Python code snippet showing how to access a pixel value in a resized image array, specifically the first channel (index 0) of the first pixel (index 0) at a given position (pos2). Below it, the integer value 100 is shown, possibly as an example output or a separate value.
مثال على استخدام Counter لحساب التكرارات
A Python code block demonstrating the use of `collections.Counter` to count the frequency of labels in a list. It includes a comment explaining its purpose, the import statement, and the assignment and display of the `label_cnt` variable.
ملاحظة حول الفئة المتطرفة Nat
A blue highlighted box containing Arabic text that points out the 'Nat' (Nature) category as an outlier due to its significantly smaller count (eight elements) compared to other categories. A line visually connects this box to the 'Nat' entry in the Counter output.
ناتج Counter لتكرار عناوين الحيوانات
The output of the `Counter` function, showing a dictionary-like structure where animal names (e.g., 'Bear', 'Cat', 'Chicken') and 'Nat' are keys, and their respective counts are values. 'Nat' has a count of 8, while other animal categories have counts ranging from 100 to 160.
مثال على تصفية البيانات
A Python code block that filters three lists (`resized_images`, `filenames`, `labels`) based on two conditions: `i not in violations` and `labels[i] != "Nat"`. This effectively removes entries associated with 'violations' and the 'Nat' category from the datasets.
📄 النص الكامل للصفحة
صور التدرج الرمادي لها قناة واحدة فقط (بدلاً من قنوات RGB الثلاث)، وقيمة كل بكسل عبارة عن رقم واحد يتراوح من 0 إلى 255، حيث تمثل قيمة البكسل 0 اللون الأسود، بينما تمثل قيمة البكسل 255 اللون الأبيض. على سبيل المثال:
resized_images[pos2][0][0]
100
وكاختبار إضافي لجودة البيانات، يقوم المقطع البرمجي التالي بحساب تكرار عنوان كل صورة حيوان في مجموعة البيانات:
--- SECTION: مثال: حساب تكرار العناصر ---
# used to count the frequency of each element in a list.
from collections import Counter
label_cnt = Counter(labels)
label_cnt
هنا يمكنك رؤية القيمة المتطرفة وهي فئة Nat (أو الطبيعة)، وتحتوي على ثمانية عناصر فقط مقارنة بالفئات الأخرى.
--- SECTION: ناتج Counter ---
Counter({'Bear': 101,
'Cat': 160,
'Chicken': 100,
'Cow': 104,
'Deer': 103,
'Duck': 103,
'Eagle': 101,
'Elephant': 100,
'Lion': 102,
'Monkey': 100,
'Nat': 8,
'Panda': 119,
'Pigeon': 115,
'Rabbit': 100,
'Sheep': 100,
'Tiger': 114,
'Wolf': 100})
تحتوي مجموعة البيانات على صور حيوانات وصور أخرى من الطبيعة؛ وذلك بهدف التعرف على الصور التي تشذ عن صور الحيوانات. يكشف Counter (العداد) عن فئة صغيرة جداً عنوانها Nat (الطبيعة)، وتحتوي على ثماني صور فقط، وعندما نقوم بكشف سريع يتضح لك أن هذه الفئة ذات قيم متطرفة (Outlier) تحتوي على صور لمناظر طبيعية ولا يوجد بها أي وجه لأي حيوان.
يقوم المقطع البرمجي التالي بإزالة صورة RGBA وصورة التدرج الرمادي، وكذلك كل الصور التي تنتمي لفئة Nat (الطبيعة) من قوائم أسماء الملفات، والعناوين، والصور التي غير حجمها.
--- SECTION: مثال: تصفية البيانات ---
N = len(labels)
resized_images = [resized_images[i] for i in range(N) if i not in violations
and labels[i] != "Nat"]
filenames = [filenames[i] for i in range(N) if i not in violations and
labels[i] != "Nat"]
labels = [labels[i] for i in range(N) if i not in violations and labels[i] !=
"Nat"]
وزارة التعليم
203
Ministry of Education
2023 - 1447
--- VISUAL CONTEXT ---
**CODE_BLOCK**: مثال على الوصول إلى قيمة بكسل
Description: A Python code snippet showing how to access a pixel value in a resized image array, specifically the first channel (index 0) of the first pixel (index 0) at a given position (pos2). Below it, the integer value 100 is shown, possibly as an example output or a separate value.
Context: Illustrates basic image array indexing and pixel value representation in grayscale images.
**CODE_BLOCK**: مثال على استخدام Counter لحساب التكرارات
Description: A Python code block demonstrating the use of `collections.Counter` to count the frequency of labels in a list. It includes a comment explaining its purpose, the import statement, and the assignment and display of the `label_cnt` variable.
Context: Shows how to use Python's `Counter` object for data frequency analysis, a common task in data quality checks.
**HIGHLIGHT_BOX**: ملاحظة حول الفئة المتطرفة Nat
Description: A blue highlighted box containing Arabic text that points out the 'Nat' (Nature) category as an outlier due to its significantly smaller count (eight elements) compared to other categories. A line visually connects this box to the 'Nat' entry in the Counter output.
Context: Highlights an important observation from the data analysis, identifying a potential outlier category that might require special handling.
**TEXT_OUTPUT**: ناتج Counter لتكرار عناوين الحيوانات
Description: The output of the `Counter` function, showing a dictionary-like structure where animal names (e.g., 'Bear', 'Cat', 'Chicken') and 'Nat' are keys, and their respective counts are values. 'Nat' has a count of 8, while other animal categories have counts ranging from 100 to 160.
Data: Counts for various animal labels: Bear: 101, Cat: 160, Chicken: 100, Cow: 104, Deer: 103, Duck: 103, Eagle: 101, Elephant: 100, Lion: 102, Monkey: 100, Nat: 8, Panda: 119, Pigeon: 115, Rabbit: 100, Sheep: 100, Tiger: 114, Wolf: 100.
Key Values: Bear: 101, Cat: 160, Chicken: 100, Cow: 104, Deer: 103, Duck: 103, Eagle: 101, Elephant: 100, Lion: 102, Monkey: 100, Nat: 8, Panda: 119, Pigeon: 115, Rabbit: 100, Sheep: 100, Tiger: 114, Wolf: 100
Context: Provides the concrete results of the frequency counting operation, allowing the user to visually identify the 'Nat' category as having a low count, indicating it as an outlier.
**CODE_BLOCK**: مثال على تصفية البيانات
Description: A Python code block that filters three lists (`resized_images`, `filenames`, `labels`) based on two conditions: `i not in violations` and `labels[i] != "Nat"`. This effectively removes entries associated with 'violations' and the 'Nat' category from the datasets.
Context: Demonstrates data cleaning techniques by filtering out unwanted data points (e.g., corrupted images, outlier categories) from multiple related lists to improve data quality.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هي السمة الأساسية لصور التدرج الرمادي مقارنة بصور RGB؟
الإجابة: صور التدرج الرمادي تحتوي على قناة لونية واحدة فقط، بينما تحتوي صور RGB على ثلاث قنوات لونية.
الشرح: تم تصميم صور التدرج الرمادي لتمثيل درجات مختلفة من اللون الرمادي فقط، مما يتطلب قناة لونية واحدة. أما صور RGB فتمزج بين الأحمر والأخضر والأزرق لإنشاء طيف واسع من الألوان، وتحتاج إلى ثلاث قنوات منفصلة.
تلميح: فكر في عدد القنوات اللونية التي تحدد تفاصيل اللون في كل نوع من الصور.
في صور التدرج الرمادي، ما هي القيم التي تتراوح بينها شدة البكسل وماذا تمثل القيمتان 0 و 255؟
الإجابة: تتراوح قيمة كل بكسل في صور التدرج الرمادي بين 0 و 255. القيمة 0 تمثل اللون الأسود، والقيمة 255 تمثل اللون الأبيض.
الشرح: يمثل نطاق القيم من 0 إلى 255 درجات مختلفة من اللون الرمادي. القيمة الدنيا (0) هي أشد درجات السواد، والقيمة القصوى (255) هي أشد درجات البياض، والقيم بينهما تمثل درجات الرمادي المتوسطة.
تلميح: تذكر أن التدرج الرمادي يتدرج من أغمق لون إلى أفتح لون. ما هي القيم التي تمثل هاتين النقطتين القصوى؟
ما هي وظيفة الكائن `Counter` في بايثون كما هو موضح في المثال؟
الإجابة: تُستخدم الكائن `Counter` في بايثون لحساب تكرار كل عنصر فريد في قائمة أو أي تسلسل قابل للتكرار.
الشرح: يقوم `Counter` بتلقي قائمة (في هذه الحالة، قائمة العناوين `labels`) وينتج قاموسًا يعرض كل عنصر فريد وعدد مرات ظهوره في القائمة الأصلية.
تلميح: يركز المثال البرمجي على 'حساب تكرار العناصر'. ما هي الأداة التي تم استخدامها لتحقيق ذلك؟
لماذا تم اعتبار الفئة 'Nat' قيمة متطرفة (Outlier) في مجموعة البيانات؟
الإجابة: تم اعتبار الفئة 'Nat' قيمة متطرفة لأنها تحتوي على عدد قليل جداً من العناصر (ثمانية عناصر فقط) مقارنة بالفئات الأخرى التي تحتوي على أعداد أكبر بكثير.
الشرح: تشير الأعداد القليلة جداً لفئة 'Nat' (صور الطبيعة) إلى أنها تمثل نسبة صغيرة وغير ممثلة لبقية مجموعة البيانات التي تركز على صور الحيوانات. هذا الاختلاف الكبير في الحجم هو ما يجعلها 'قيمة متطرفة'.
تلميح: انظر إلى ناتج `Counter` وعدد العناصر المذكور للفئة 'Nat' مقارنة بالفئات الأخرى. ما الذي يميزها بشكل واضح؟
ما هي الأهداف الرئيسية لعملية تصفية البيانات الموضحة في المثال البرمجي الأخير؟
الإجابة: تهدف عملية تصفية البيانات إلى إزالة الصور التي تكون بصيغة RGBA أو التدرج الرمادي، بالإضافة إلى إزالة جميع الصور التي تنتمي للفئة 'Nat' (الطبيعة) من قوائم أسماء الملفات والعناوين والصور المصغرة.
الشرح: يتم استبعاد صور RGBA والتدرج الرمادي لأنها قد لا تكون متوافقة مع معالجة صور الحيوانات أو قد تتطلب معالجة خاصة. كما يتم استبعاد فئة 'Nat' لأنها قيمة متطرفة ولا تمثل صور الحيوانات المستهدفة، مما يضمن أن مجموعة البيانات النهائية تركز على بيانات ذات جودة واتساق أعلى.
تلميح: لاحظ الشروط المستخدمة في الكود لتحديد العناصر التي سيتم الاحتفاظ بها. ما هي أنواع البيانات التي يتم استبعادها؟