📚 مصادر البيانات
المفاهيم الأساسية
مصادر البيانات الرئيسة (Primary Data Source): بيانات لم تُجمع من قبل، تُجمع مباشرة من المصدر الأصلي (مثل: أجهزة الاستشعار، الاستبانات).
مصادر البيانات الثانوية (Secondary Data Source): بيانات تُشتق أو تُحصل عليها من خلال استخدام بيانات أخرى تم جمعها من مصادر رئيسة.
خريطة المفاهيم
```markmap
علم البيانات
ما تعلمته
جمع البيانات والتحقق من صحتها
#### جمع البيانات
-
مصادر البيانات الرئيسة
- تعريف: بيانات لم تُجمع من قبل
- طرق الجمع: أجهزة استشعار، تسجيل بيانات، استبانات
- أمثلة: مقياس درجة الحرارة، مقياس سرعة الرياح، استبانة تفضيلات العملاء
- مصادر البيانات الثانوية
- تعريف: بيانات تُشتق من مصادر رئيسة
- طريقة الحصول: استخدام بيانات أخرى ومعالجتها
- مثال: حساب درجة حرارة الرياح الباردة من بيانات الحرارة والرياح
- أهمية التصاريح القانونية
- منصات البيانات المفتوحة
##### خصائص وعمليات جمع البيانات
- أهم مرحلة في البحث العلمي
- تتطلب فهمًا عميقًا وتخطيطًا وعملًا دؤوبًا
- تختلف طرائقها باختلاف نوع البيانات
- التحقق من صحة ودقة خطوات الجمع أمر هام
##### أدوات جمع البيانات
- أجهزة الاستشعار
- أجهزة تسجيل البيانات
- مثال: أجهزة قياس الطقس (درجة الحرارة، سرعة الرياح، الرطوبة)
#### ترميز البيانات
#### التحقق من صحة البيانات
- خطواته
- أنماطه
- طرائق التحقق من صحة الإدخال
#### معايير جودة المعلومات
المصطلحات الرئيسة
المفاهيم الأساسية
- البيانات (Data)
- المعلومات (Information)
- المعرفة (Knowledge)
- البيانات الأولية (Raw Data)
- القيمة (Value)
العمليات والأدوار
- جمع البيانات (Data Collection)
- تنظيف البيانات (Data Cleaning)
- تجهيز البيانات (Data Preparation)
- تحليل البيانات (Data Analysis)
- التحليل الاستكشافي للبيانات (EDA)
- التنقيب في البيانات (Data Mining)
- تصوير البيانات (Data Visualization)
- محلل البيانات (Data Analyst)
- عالم البيانات (Data Scientist)
التقنيات والمجالات
- الذكاء الاصطناعي (AI)
- ذكاء الأعمال (BI)
- البيانات الضخمة (Big Data)
- دورة حياة علم البيانات (Data Science Life Cycle)
خصائص البيانات الضخمة (5Vs)
- الحجم (Volume)
- السرعة (Velocity)
- التنوع (Variety)
- الموثوقية (Veracity)
- القيمة (Value)
الأدوات والتخزين
- البايثون (Python)
- مفكرة جوبيتر (Jupyter Notebook)
- الحوسبة في الذاكرة (In-Memory Computing)
- التخزين السحابي (Cloud Storage)
- مستودع البيانات (Data Warehouse)
- بحيرة بيانات (Data Lake)
- مايكروسوفت إكسل (Microsoft Excel)
```
نقاط مهمة
- التصنيف الأساسي لمصادر البيانات هو: رئيسة وثانوية.
- مثال على مصدر ثانوي: حساب درجة حرارة الرياح الباردة (Wind-Chill Temperature) باستخدام الصيغة: (درجة حرارة الهواء) - (سرعة الرياح × 0.7).
- تختلف المصادر الرئيسة عن الثانوية في: الأصالة، الشكل، الدقة، المصدر، التكلفة (كما هو موضح في الجدول 2.1).