📚 معايير جودة المعلومات
المفاهيم الأساسية
الدقة (Accuracy): التأكد من صحة المعلومات وخلوها من الأخطاء.
الملاءمة (Appropriateness): أن تكون المعلومات مرتبطة بموضوع البحث.
التوقيت (Timeliness): مدى حداثة المعلومات ومناسبتها لموضوع البحث.
مستوى التفاصيل (Level of Detail): المقدار المناسب من التفاصيل الذي تقدمه المعلومات.
الكفاية (Completeness): أن تعطي المعلومات صورة كاملة عن الواقع.
خريطة المفاهيم
```markmap
علم البيانات
ما تعلمته
جمع البيانات والتحقق من صحتها
#### جمع البيانات
-
مصادر البيانات الرئيسة
- تعريف: بيانات لم تُجمع من قبل
- طرق الجمع: أجهزة استشعار، تسجيل بيانات، استبانات
- أمثلة: مقياس درجة الحرارة، مقياس سرعة الرياح، استبانة تفضيلات العملاء
- مصادر البيانات الثانوية
- تعريف: بيانات تُشتق من مصادر رئيسة
- طريقة الحصول: استخدام بيانات أخرى ومعالجتها
- مثال: حساب درجة حرارة الرياح الباردة من بيانات الحرارة والرياح
- مصادر البيانات الداخلية والخارجية
- مصادر داخلية: البيانات التي يتم جمعها داخلياً من قبل جهة العمل.
- مصادر خارجية: البيانات التي يتم تحصيلها من خارج مجال جهة العمل.
- أهمية التصاريح القانونية
- منصات البيانات المفتوحة
##### خصائص وعمليات جمع البيانات
- أهم مرحلة في البحث العلمي
- تتطلب فهمًا عميقًا وتخطيطًا وعملًا دؤوبًا
- تختلف طرائقها باختلاف نوع البيانات
- التحقق من صحة ودقة خطوات الجمع أمر هام
##### أدوات جمع البيانات
- أجهزة الاستشعار
- أجهزة تسجيل البيانات
- مثال: أجهزة قياس الطقس (درجة الحرارة، سرعة الرياح، الرطوبة)
#### ترميز البيانات
#### التحقق من صحة البيانات
- خطواته
- أنماطه
- طرائق التحقق من صحة الإدخال
#### معايير جودة المعلومات
- التأكد من صحة المعلومات
- التحقق من المصادر الموثوقة
- الملاءمة (Appropriateness)
- ارتباط المعلومات بموضوع البحث
- تجنب المعلومات غير المتعلقة
- مدى حداثة المعلومات
- التأكد من تاريخ النشر
- مستوى التفاصيل (Level of Detail)
- المقدار المناسب من التفاصيل
- يعتمد على تعقيد المشكلة
- إعطاء صورة كاملة عن الواقع
- ضرورية لاتخاذ القرارات الصحيحة
المصطلحات الرئيسة
المفاهيم الأساسية
- البيانات (Data)
- المعلومات (Information)
- المعرفة (Knowledge)
- البيانات الأولية (Raw Data)
- القيمة (Value)
العمليات والأدوار
- جمع البيانات (Data Collection)
- تنظيف البيانات (Data Cleaning)
- تجهيز البيانات (Data Preparation)
- تحليل البيانات (Data Analysis)
- التحليل الاستكشافي للبيانات (EDA)
- التنقيب في البيانات (Data Mining)
- تصوير البيانات (Data Visualization)
- محلل البيانات (Data Analyst)
- عالم البيانات (Data Scientist)
التقنيات والمجالات
- الذكاء الاصطناعي (AI)
- ذكاء الأعمال (BI)
- البيانات الضخمة (Big Data)
- دورة حياة علم البيانات (Data Science Life Cycle)
خصائص البيانات الضخمة (5Vs)
- الحجم (Volume)
- السرعة (Velocity)
- التنوع (Variety)
- الموثوقية (Veracity)
- القيمة (Value)
الأدوات والتخزين
- البايثون (Python)
- مفكرة جوبيتر (Jupyter Notebook)
- الحوسبة في الذاكرة (In-Memory Computing)
- التخزين السحابي (Cloud Storage)
- مستودع البيانات (Data Warehouse)
- بحيرة بيانات (Data Lake)
- مايكروسوفت إكسل (Microsoft Excel)
```
نقاط مهمة
- يجب التحقق من جودة المعلومات قبل المضي قدماً في استخراج المعرفة.
- تكمن أهمية المعايير الخمسة في أنها تساعد على التحقق من موثوقية المعلومات من المواقع الإلكترونية.
- المعلومات غير الموثوقة أو غير الكاملة لا يمكن استخدامها بشكل صحيح لاتخاذ القرارات.