معالجة البيانات غير المنظمة للصور في التعلم العميق - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

تتناول هذه الصفحة تحليل ومعالجة البيانات غير المنظمة، مع التركيز على الصور في سياق التعلم العميق. يتم شرح كيفية تطبيق دالة `resize_images_v2` لتغيير حجم الصور إلى 224 × 224 بكسل، بدلاً من 100 × 100 المستخدمة سابقًا، لتناسب متطلبات خوارزميات التعلم العميق. يتم استخدام مجموعة فرعية من فئات الحيوانات مثل الأسد والدجاج والبط، مع إمكانية تعديل الفئات عبر المتغير `labels_to_keep`.

يتم مناقشة أهمية إعادة ترتيب البيانات عشوائيًا لتجنب تضليل الخوارزميات، خاصة في مجال رؤية الحاسب، حيث أن الصور مرتبة حسب الفئة في القوائم الأصلية. يتم تقديم مقطع برمجي باستخدام مكتبة `random` في Python لربط القوائم وإعادة ترتيبها بنفس الترتيب، مما يضمن تطابق الصور مع العناوين وأسماء الملفات.

يتم تسليط الضوء على التحديات المرتبطة بمعالجة البيانات غير المنظمة، مثل استهلاك الوقت والموارد الحاسوبية، وكيفية التغلب عليها عبر تقنيات مثل تغيير الحجم وإعادة الترتيب لتحسين كفاءة النماذج الحاسوبية.

📄 النص الكامل للصفحة

البيانات غير المنظمة (Unstructured Data) متنوعة، ويمكن أن تحتاج إلى كثير من الوقت والموارد الحاسوبية. ويعد هذا صحيحًا بشكل خاص عند معالجتها عن طريق أساليب تعلم عميقة ومعقدة. كما سينفذ لاحقًا في هذا الدرس، ولتقليل الوقت الحسابي يتم تطبيق دالة ( )resize_images_v2 على مجموعة فرعية من الصور من فئات الحيوانات:

resized_images,labels,filenames=resize_images_v2(
  "AnimalFace/Image",
  width = 224,
  height = 224,
  labels_to_keep=['Lion', 'Chicken', 'Duck', 'Rabbit', 'Deer',
  'Cat', 'Wolf', 'Bear', 'Pigeon', 'Eagle']
)

BearHead
CatHead
ChickenHead
CowHead
DeerHead
DuckHead
EagleHead
ElephantHead
LionHead

MonkeyHead
Natural
PandaHead
PigeonHead
RabbitHead
SheepHead
TigerHead
WolfHead

هذه العناوين العشرة
التي سيتم استخدامها.

يمكنك بسهولة تعديل المتغير labels_to_keep (العناوين_المحتفظ_بها)؛ للتركيز على فئات معينة، وستلاحظ أن عرض الصور وارتفاعها تم ضبطهما على 224 × 224، بدلاً من الشكل 100 × 100 الذي استخدم في الدرس السابق؛ لأن إحدى طرائق التجميع القائمة على التعلم العميق - الواردة في هذا الدرس - تتطلب أن تكون الصور هذه الأبعاد ولذا اعتمد الشكل 224 × 224؛ لضمان منح حق الوصول لجميع الطرائق إلى المدخلات نفسها.
كما ذكر في الدرس السابق فإن القوائم الأصلية: (الصور_المعدل حجمها)، وlabels (العناوين)، وfilenames (أسماء الملفات) تشتمل على الصور التي تنتمي لكل فئة مجمعة معًا. على سبيل المثال: تظهر جميع صور Lion (الأسد) معًا في بداية القائمة المعدل حجمها. وقد يضلل ذلك العديد من الخوارزميات، خاصة في مجال رؤية الحاسب، وطالما أنه يمكن فهرسة الصور عشوائيًا لكل قائمة من القوائم الثلاث، فمن المهم التأكد من استخدام الترتيب العشوائي نفسه لهذه القوائم. وبخلاف ذلك، من المستحيل العثور على العنوان الصحيح لصورة معينة أو اسم الملف الصحيح لها.
في الدرس السابق، تم إجراء إعادة الترتيب (Shuffling) باستخدام الدالة ( )train_test_split. وبما أن هذه الدالة غير قابلة للتطبيق على مهام التجميع، فستستخدم المقطع البرمجي التالي لإعادة الترتيب:

import random

#connects the three lists together, so that they are shuffled in the same order
connected = list(zip(resized_images, labels, filenames))
random.shuffle(connected)
#disconnects the three lists
resized_images, labels, filenames= zip(*connected)

وزارة التعليم
223
2025 - 1447

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هي المشكلة الرئيسية التي تعالجها البيانات غير المنظمة في سياق التعلم العميق؟

الإجابة: تحتاج البيانات غير المنظمة إلى الكثير من الوقت والموارد الحاسوبية لمعالجتها، خاصة عند استخدام أساليب تعلم عميقة ومعقدة.

الشرح: النص يوضح أن معالجة البيانات غير المنظمة تتطلب وقتًا وموارد كبيرة، وهي مشكلة يتم محاولة حلها أو تخفيفها في هذا الدرس.

تلميح: فكر في العوامل التي تزيد من صعوبة معالجة البيانات.

ما هي الدالة المستخدمة لتقليل الوقت الحسابي عند معالجة مجموعة فرعية من الصور؟

الإجابة: تُستخدم الدالة resize_images_v2.

الشرح: النص يذكر صراحةً استخدام الدالة resize_images_v2 لضبط أبعاد الصور لتقليل الوقت الحسابي.

تلميح: ابحث عن اسم الدالة التي تم ذكرها صراحةً لضبط أبعاد الصور.

ما هي الأبعاد المحددة التي تم ضبط الصور عليها باستخدام الدالة resize_images_v2؟

الإجابة: تم ضبط عرض الصور وارتفاعها على 224 × 224 بكسل.

الشرح: النص يذكر بوضوح أن 'عرض الصور وارتفاعها تم ضبطهما على 224 × 224'.

تلميح: ابحث عن القيم الرقمية التي تم تحديدها كـ width و height.

ما هي المشكلة التي قد تنشأ إذا لم يتم استخدام نفس الترتيب العشوائي عند إعادة ترتيب (shuffling) القوائم الثلاث (الصور المعدل حجمها، العناوين، أسماء الملفات)؟

الإجابة: يصبح من المستحيل العثور على العنوان الصحيح لصورة معينة أو اسم الملف الصحيح لها، مما يضلل العديد من الخوارزميات، خاصة في مجال رؤية الحاسب.

الشرح: يؤكد النص على أهمية الترتيب المتزامن للقوائم الثلاث لضمان إمكانية ربط الصورة بتسميتها وملفها الأصلي بشكل صحيح.

تلميح: فكر في العلاقة بين هذه القوائم الثلاث وكيف يؤثر فقدان هذه العلاقة على تحديد البيانات.

لماذا من المهم التأكد من استخدام الترتيب العشوائي نفسه للقوائم: (الصور_المعدل حجمها)، وlabels (العناوين)، وfilenames (أسماء الملفات) عند معالجة الصور في مجال رؤية الحاسب؟

الإجابة: لأن القوائم الأصلية تشتمل على الصور التي تنتمي لكل فئة مجمعة معًا، وهذا قد يضلل العديد من الخوارزميات، خاصة في مجال رؤية الحاسب، ولضمان العثور على العنوان الصحيح لصورة معينة أو اسم الملف الصحيح لها.

الشرح: الترتيب العشوائي يمنع تحيز الخوارزميات الناتج عن تجميع الصور المتشابهة معًا.

تلميح: فكر في كيفية تأثير ترتيب البيانات على أداء الخوارزميات

التصنيف: مفهوم جوهري | المستوى: متوسط