📝 ملخص الصفحة
📚 تمرينات برمجية في علم البيانات
المفاهيم الأساسية
لا تحتوي الصفحة على تعريفات جديدة للمفاهيم.
خريطة المفاهيم
```markmap
تمرينات مراجعة مفاهيم علم البيانات
المقارنة بين هياكل البيانات
كائن المتسلسلة (Series)
إطار البيانات (DataFrame)
عمليات معالجة البيانات
فهرسة البيانات (Indexing)
تصفية البيانات (Filtering)
خطوات تحليل البيانات
تنظيف البيانات
#### أهمية التنظيف قبل التحليل
تمرينات تطبيقية
التمرين 4: توليد أرقام عشوائية
#### استيراد مكتبة random
#### استخدام random.randrange(1, 100)
التمرين 5: استكشاف مجموعة بيانات
#### فتح ملف Excel في جوبيتر
#### قراءة ورقة عمل محددة (18) إلى DataFrame
#### طباعة شكل DataFrame (shape)
#### طباعة أنواع بيانات الأعمدة (dtypes)
#### طباعة أسماء الأعمدة (columns)
```
نقاط مهمة
- تحتوي الصفحة على تمرينين تطبيقيين (4 و 5) لمراجعة مهارات برمجية.
- التمرين 4 يركز على توليد أرقام عشوائية باستخدام مكتبة `random` في بايثون.
- التمرين 5 يركز على الخطوات الأولية لاستكشاف مجموعة بيانات باستخدام `pandas`، مثل قراءة ملف Excel وفحص هيكل البيانات.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 4 بطاقة لهذه الصفحة
في لغة بايثون، إذا أردنا توليد رقم عشوائي صحيح بين 1 و 100 (شاملاً للرقم 100) باستخدام الدالة randrange()، فما هي المعاملات الصحيحة التي يجب تمريرها للدالة؟
- أ) random.randrange(0, 100)
- ب) random.randrange(1, 100)
- ج) random.randrange(1, 101)
- د) random.randrange(100)
الإجابة الصحيحة: c
الإجابة: random.randrange(1, 101)
الشرح: 1. الدالة randrange(start, stop) تولد أرقاماً من start إلى stop-1.
2. لتوليد رقم بين 1 و100، يجب أن يكون الحد الأدنى 1.
3. لتضمين الرقم 100، يجب أن يكون الحد الأعلى 101 (لأن 101-1 = 100).
4. الإجابة الصحيحة هي random.randrange(1, 101).
تلميح: تذكر أن الحد الأعلى في randrange غير مشمول في النتائج.
التصنيف: صيغة/خطوات | المستوى: سهل
عند قراءة ملف Excel باستخدام pandas في بايثون، ما هي الخطوات الأساسية المطلوبة لتحميل ورقة عمل محددة باسمها أو رقمها ثم طباعة شكل إطار البيانات (shape)؟
- أ) استخدام pd.read_csv() ثم طباعة df.head()
- ب) استخدام pd.read_excel() مع معامل sheet_name، ثم طباعة df.shape
- ج) استخدام pd.DataFrame() ثم طباعة df.columns
- د) استخدام pd.open_excel() ثم طباعة df.info()
الإجابة الصحيحة: b
الإجابة: استخدام pd.read_excel() مع معامل sheet_name، ثم طباعة df.shape
الشرح: 1. استيراد pandas: import pandas as pd.
2. قراءة الملف وورقة العمل: df = pd.read_excel('tourist-indicators.xlsx', sheet_name='18').
3. طباعة شكل الإطار: print(df.shape).
4. shape تُرجع tuple يحتوي على (عدد الصفوف, عدد الأعمدة).
تلميح: تتضمن العملية دالة القراءة ثم الوصول إلى سمة خاصة بالإطار.
التصنيف: صيغة/خطوات | المستوى: متوسط
ما هو التسلسل المنطقي الصحيح للخطوات التالية لتحليل بيانات من ملف Excel باستخدام pandas، بناءً على المطلوب في النشاط؟
- أ) قراءة الملف → استيراد المكتبة → طباعة أسماء الأعمدة → طباعة الشكل → طباعة أنواع البيانات
- ب) استيراد المكتبة → قراءة الملف وورقة العمل → طباعة الشكل → طباعة أنواع البيانات → طباعة أسماء الأعمدة
- ج) طباعة أنواع البيانات → استيراد المكتبة → قراءة الملف → طباعة الشكل → طباعة أسماء الأعمدة
- د) استيراد المكتبة → طباعة أسماء الأعمدة → قراءة الملف → طباعة الشكل → طباعة أنواع البيانات
الإجابة الصحيحة: b
الإجابة: استيراد المكتبة → قراءة الملف وورقة العمل → طباعة الشكل → طباعة أنواع البيانات → طباعة أسماء الأعمدة
الشرح: 1. الخطوة الأساسية الأولى: استيراد مكتبة pandas.
2. الخطوة الثانية: تحميل البيانات من الملف وورقة العمل المحددة إلى DataFrame.
3. الخطوة الثالثة: استكشاف هيكل البيانات بطباعة شكلها (عدد الصفوف والأعمدة).
4. الخطوة الرابعة: فهم طبيعة البيانات بطباعة أنواعها.
5. الخطوة الخامسة: معرفة محتوى البيانات بطباعة أسماء الأعمدة.
تلميح: ابدأ بالاستعداد (الاستيراد)، ثم جلب البيانات، ثم استكشافها.
التصنيف: صيغة/خطوات | المستوى: متوسط
لتوليد رقم عشوائي صحيح يقع في النطاق من 1 إلى 100 (بحيث يكون الرقمان 1 و 100 ضمن الخيارات الممكنة) باستخدام مكتبة random في بايثون، أي الأوامر التالية هو الصحيح؟
- أ) random.randrange(1, 100)
- ب) random.randrange(1, 101)
- ج) random.randrange(0, 100)
- د) random.randrange(1, 102)
الإجابة الصحيحة: b
الإجابة: random.randrange(1, 101)
الشرح: 1. لاستخدام الدوال العشوائية، يجب أولاً استيراد مكتبة random.
2. دالة randrange(start, stop) تولد أرقاماً تبدأ من القيمة start وتنتهي عند القيمة (stop - 1).
3. للحصول على الرقم 100 كأقصى قيمة ممكنة، يجب أن نضع الحد الأعلى 101.
4. بالتالي، الكود الصحيح هو random.randrange(1, 101) لضمان شمول الرقم 100 في النتائج.
تلميح: تذكر أن المعامل الثاني (الحد الأعلى) في دالة randrange غير مشمول في النتائج المستخرجة.
التصنيف: صيغة/خطوات | المستوى: متوسط