📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
المشروع
نوع: محتوى تعليمي
المشروع
نوع: محتوى تعليمي
تصنيف النص هو عملية مكونة من خطوتين تشمل:
الخطوة الأولى: استخدام مجموعة من نصوص التدريب ذات القيم (التصنيفات) المعروفة لتدريب نموذج التصنيف.
الخطوة الثانية: استخدام نموذج التدريب للتنبؤ بالقيم لكل نص في مجموعة بيانات الاختبار. القيم في مجموعة بيانات الاختبار إما غير معروفة أو مخبأة وتستخدم لاحقًا في عملية التحقق.
نوع: محتوى تعليمي
يجب تمثيل النصوص في كل من مجموعات بيانات التدريب والاختبار بالمتجهات قبل استخدامها. تُستخدم أدوات TfidfVectorizer أو CountVectorizer من مكتبة سكيليرن (Sklearn) في البرمجة الاتجاهية.
نوع: محتوى تعليمي
تقدم مكتبة سكيليرن (Sklearn) في لغة البايثون قائمة طويلة من نماذج التصنيف، مثل:
GradientBoostingClassifier()
DecisionTreeClassifier()
RandomForestClassifier()
نوع: محتوى تعليمي
مهمتك هي استخدام مجموعة بيانات التدريب IMDb المستخدمة في هذا الدرس لتدريب النموذج الذي يحقق أعلى درجة من الدقة على مجموعة بيانات الاختبار (imdb_data/imdb_test.csv). يمكنك تحقيق ذلك عبر:
1
نوع: QUESTION
1 استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن الموضحة بالأعلى.
2
نوع: QUESTION
2 إعادة تشغيل المفكرة التفاعلية لديك بعد الاستبدال، لحساب دقة كل نموذج جديد بعد تجربته.
3
نوع: QUESTION
3 إنشاء تقرير للمقارنة بين دقة كل النماذج التي جربتها وتحديد النموذج الذي حقق نتائج دقيقة.
نوع: METADATA
192
🔍 عناصر مرئية
Project Icon
A stylized black and white icon resembling a camera or projector, positioned above and to the right of the 'المشروع' title, visually representing the concept of a project or presentation.
📝 أسئلة اختبارية
عدد الأسئلة: 3
سؤال 1: استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن الموضحة بالأعلى.
- أ) استخدام GradientBoostingClassifier()
- ب) استخدام DecisionTreeClassifier()
- ج) استخدام RandomForestClassifier()
- د) الاحتفاظ بـ MultinomialNB
الإجابة الصحيحة: يجب استبدال MultinomialNB بنماذج مثل GradientBoostingClassifier() أو DecisionTreeClassifier() أو RandomForestClassifier() من مكتبة sklearn
الشرح: المطلوب هو تغيير نموذج التصنيف في الكود من MultinomialNB إلى أحد النماذج الأخرى المذكورة في النص لتحسين الدقة.
تلميح: راجع قائمة نماذج التصنيف المذكورة في النص واختر واحدًا منها.
سؤال 2: إعادة تشغيل المفكرة التفاعلية لديك بعد الاستبدال، لحساب دقة كل نموذج جديد بعد تجربته.
- أ) تشغيل الكود مرة واحدة فقط
- ب) تشغيل الكود وتسجيل الدقة لكل نموذج
- ج) تخطي حساب الدقة
- د) استخدام مجموعة التدريب فقط
الإجابة الصحيحة: تشغيل الكود بعد استبدال النموذج وتسجيل دقة التصنيف على مجموعة الاختبار imdb_test.csv
الشرح: بعد تغيير النموذج في الكود، يجب تشغيله لحساب الدقة باستخدام دالة مثل accuracy_score من sklearn.
تلميح: تأكد من تحميل مجموعة بيانات الاختبار وحساب الدقة بشكل صحيح.
سؤال 3: إنشاء تقرير للمقارنة بين دقة كل النماذج التي جربتها وتحديد النموذج الذي حقق نتائج دقيقة.
- أ) تجاهل المقارنة
- ب) مقارنة الدقة وتحديد الأفضل
- ج) اختيار نموذج عشوائيًا
- د) استخدام متوسط الدقة فقط
الإجابة الصحيحة: إنشاء جدول أو قائمة بمقارنة دقة النماذج المختبرة وتحديد النموذج ذو أعلى دقة
الشرح: يجب تجميع نتائج الدقة من الخطوة السابقة ومقارنتها لتحديد أفضل نموذج بناءً على أعلى دقة.
تلميح: استخدم وسيلة عرض مناسبة مثل جدول أو رسم بياني للمقارنة.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هي الخطوات الأساسية في عملية المشروع لتصنيف النصوص؟
الإجابة: الخطوة الأولى: تدريب نموذج التصنيف باستخدام مجموعة من نصوص التدريب ذات التصنيفات المعروفة. الخطوة الثانية: استخدام نموذج التدريب للتنبؤ بتصنيفات نصوص مجموعة بيانات الاختبار.
الشرح: يشرح هذا السؤال عملية المشروع بالتفصيل، حيث يتم تقسيمها إلى مرحلة تدريب النموذج وتحديد تصنيفاته، ثم مرحلة تقييم أداء النموذج على بيانات جديدة.
تلميح: فكر في المراحل التي يمر بها أي نموذج تعلم آلي قبل استخدامه للتنبؤ.
ما هي الأدوات المستخدمة لتمثيل النصوص في مجموعات بيانات التدريب والاختبار بالمتجهات؟
الإجابة: تُستخدم أدوات TfidfVectorizer أو CountVectorizer من مكتبة سكيليرن (Sklearn) في البرمجة الاتجاهية.
الشرح: توضح هذه البطاقة أهمية تحويل النصوص إلى متجهات رقمية لتتمكن خوارزميات التعلم الآلي من معالجتها، وتقدم الأدوات الشائعة لتحقيق ذلك.
تلميح: ما هي التقنيات التي تحول النصوص إلى صيغة رقمية يمكن للنماذج فهمها؟
اذكر ثلاثة نماذج تصنيف متاحة في مكتبة سكيليرن (Sklearn) يمكن استخدامها في المشروع.
الإجابة: GradientBoostingClassifier(), DecisionTreeClassifier(), RandomForestClassifier().
الشرح: هذه البطاقة تستعرض بعض نماذج التصنيف الشائعة والمتوفرة في مكتبة Sklearn، والتي يمكن للطالب استخدامها لتجربة أداء مختلف في المشروع.
تلميح: ابحث عن أنواع الخوارزميات التي تستخدم لاتخاذ القرارات بناءً على البيانات.
ما هو الهدف الرئيسي من المشروع المذكور في الصفحة؟
الإجابة: استخدام مجموعة بيانات التدريب IMDb لتدريب نموذج يحقق أعلى درجة من الدقة على مجموعة بيانات الاختبار (imdb_data/imdb_test.csv)، وذلك عبر استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن.
الشرح: تحدد هذه البطاقة الهدف العام للمشروع، والذي يتمثل في مقارنة أداء نماذج تصنيف مختلفة على مجموعة بيانات محددة للوصول إلى النموذج الأكثر دقة.
تلميح: فكر في ما يُطلب من الطالب إنجازه كناتج نهائي لهذا المشروع.
ما هي الخطوات الثلاث التي يجب على الطالب اتباعها لإكمال المشروع؟
الإجابة: 1. استبدال المصنف MultinomialNB بنماذج تصنيف أخرى من مكتبة سكيليرن. 2. إعادة تشغيل المفكرة التفاعلية لحساب دقة كل نموذج جديد. 3. إنشاء تقرير للمقارنة بين دقة النماذج وتحديد الأفضل.
الشرح: تقدم هذه البطاقة الخطوات العملية والتوجيهات المباشرة للطالب لتنفيذ المشروع بنجاح، بدءًا من تعديل الكود وحتى تقديم النتائج.
تلميح: ما هي التعليمات الإجرائية التي توجه الطالب خلال تنفيذ المشروع؟