📚 التحقق من صحة إدخال البيانات
المفاهيم الأساسية
التحقق من صحة إدخال البيانات: أي نشاط يتحقق من أن البيانات المدخلة تأتي من مجموعة قيم معتمدة، وتتوافق مع القواعد المقبولة، وقد تتبعها عمليات تصحيحية. تهدف إلى ضمان الدقة والجودة.
خريطة المفاهيم
```markmap
الوحدة الأولى: علم البيانات
المفاهيم الأساسية
البيانات والمعلومات والمعرفة
- تعريف: حقائق أو أرقام أولية غير معالجة
- مثال: بيانات درجة الحرارة العظمى ومتوسط هطول الأمطار
- تعريف: بيانات تمت معالجتها وأصبح لها معنى في سياق محدد ومفيد
- مثال: جدول أحوال الطقس
- تعريف: استنتاج من المعلومات يساعد في اتخاذ القرارات
- مثال: معرفة أن طقس يناير و فبراير أكثر برودة من مارس وأبريل، مما يساعد في تخطيط موسم الرياض
- مثال تطبيقي: إبلاغ السائحين والمشاركين في حدث موسم الرياض للاستعداد للطقس
أنواع البيانات
- مثال: 50، 6.25، -10، 0003756
- خاصية: يمكن ترتيبها تصاعدياً أو تنازلياً
- مثال: سعد، أحمر، رسالة قصيرة، KSA
- البيانات الأبجدية الرقمية
- مثال: #، $، %، الرياض، رقم 10-1، 6 - مارس - 2022
- مثال: مخططات، رسوم بيانية، صور
-
بيانات مقاطع الفيديو: سلسلة من الصور المتحركة (مثل: إعلان تلفزيوني، مقطع فيديو عن موسم الرياض).
- البيانات الصوتية: الأصوات والتأثيرات الصوتية المختلفة (مثل: تسجيلات إرشادية للمتاحف والأماكن السياحية).
- البيانات الثابتة: لا تتغير بعد تسجيلها (مثال: مجلة مطبوعة).
- بيانات متغيرة (ديناميكية): قد تتغير بعد تسجيلها وتحتاج تحديثاً (مثال: موقع إلكتروني).
مثال عام: إجراءات علم البيانات
- المرحلة الأولى: جمع البيانات الأولية (قراءات المستشعرات)
- المرحلة الثانية: تحليل البيانات (إنشاء رسم بياني أو جدول للمعلومات)
- المرحلة الثالثة: توليد المعرفة (الاستنتاج واتخاذ القرار)
ترميز البيانات
- تعريف: تنظيم وترتيب البيانات الأولية باستخدام رموز.
- أمثلة من الحياة اليومية:
-
رموز المطارات (IATA): رمز مكون من 3 حروف.
- DMM: مطار الملك فهد الدولي
- JED: مطار الملك عبد العزيز الدولي
- RUH: مطار الملك خالد الدولي
- رموز العملات: اختصارات متعارف عليها.
- SAR: الريال السعودي
- USD: الدولار الأمريكي
- EUR: اليورو
- إدخال أسرع للبيانات (مثل: كتابة RUH بدلاً من مطار الملك خالد الدولي).
- تأخذ مساحة أقل (مثل: رموز تسجيل المركبات الدولية على وسائل النقل).
- تسريع عمليات البحث عن البيانات (مثل: الرمز البريدي لتسهيل توزيع البريد).
- معنى غامض للبيانات (صعوبة التمييز بين الرموز المتشابهة).
- صعوبة فهم الترميز (صعوبة تفسير أو تذكر معنى الرمز).
- الرموز المستخدمة قد تستنفذ (عندما يكون عدد العناصر كبيراً جداً).
أمثلة على الرموز المرئية
#### الرموز الشريطية (Barcodes)
- الوصف: خطوط سوداء رفيعة مع أرقام تحتها.
- الغرض: تنظيم المعلومات وفهرستها أو وضع علامة على أسعار المنتجات.
- مكونات الأرقام:
- الأرقام الستة الأولى: تحدد الشركة المصنعة أو البائعة.
- الأرقام الستة التالية: تصف المنتج نفسه.
- الرقم الأخير: للتحقق من القراءة الصحيحة بواسطة الماسح الضوئي.
#### رموز الاستجابة السريعة (QR Codes)
- الوصف: أنماط مربعة أو نقطية سوداء متجاورة.
- الغرض: يحتوي على معلومات أكثر من الرمز الشريطي.
- ما يمكن أن يشير إليه: مواقع إلكترونية، مقاطع فيديو، ملفات رقمية.
- طريقة القراءة: باستخدام كاميرات الهواتف الذكية.
#### رقم الكتاب المعياري الدولي (ISBN)
- الوصف: رقم فريد مكون من خمس مجموعات أرقام.
- الغرض: تحديد عناوين الكتب وإصداراتها.
- مكونات الأرقام:
-
الرقم البادئ: يتكون من ثلاثة أرقام (978 أو 979). للكتب السعودية: 978.
- رقم التسجيل: معرف للبلد. للكتب السعودية: 603 أو 9960.
- رقم المسجل: معرف للناشر.
- رقم النشر: قد يصل إلى ستة أرقام، يحدد إصدار محدد.
- رقم التحقق: رقم واحد في النهاية، للتحقق من صحة باقي الأرقام.
جودة المعلومات
- تعريف: مدى استخدام المعلومات في اتخاذ القرارات.
- أهميتها:
- تحديد الاحتياجات الفعلية للمشروعات.
- توجيه الخدمات.
- زيادة الكفاءة.
- مخاطر المعلومات غير الدقيقة:
- خلل في الأعمال.
- تقليل الكفاءة.
- إنجاز المشروعات بشكل غير صحيح.
- معايير الجودة (Quality standards):
-
الدقة (Accuracy): التأكد من صحة المعلومات وخلوها من الأخطاء.
- الملاءمة (Appropriateness): مدى ارتباط المعلومات بالموضوع أو السؤال البحثي.
- التوقيت (Timeliness): مدى حداثة المعلومات ومناسبتها لموضوع البحث.
- عند استخدامه يجب مراعاة:
- التحقق من تاريخ المصادر المستخدمة.
- التحقق من تاريخ الكلمات المفتاحية الخاصة بالحقوق الفكرية.
- التحقق من تاريخ مراجعة أو تحرير المعلومات.
- التحقق من تاريخ النشر.
- مستوى التفاصيل (Level of Detail): تحديد جودة المعلومات من خلال كمية التفاصيل التي تقدمها.
- الكفاية (Completeness): شمولية المعلومات المقدمة لإعطاء صورة كاملة عن الواقع.
- مثال تطبيقي: موقع المركز الوطني للأرصاد
- الدقة: يمكن التحقق من دقة المعلومات (مثل: نسبة 53% في العنوان تشير لموقع حكومي).
- الملاءمة: المعلومات مرتبطة بموضوع البحث عن الطقس.
- التوقيت: يمكن رؤية تاريخ المعلومات المعروضة للتأكد من حداثتها.
- مستوى التفاصيل: يحتوي على معلومات كافية عن الطقس.
- الكفاية: يوفر بيانات شاملة (المدينة، التاريخ، الرطوبة، سرعة الرياح، درجة الحرارة) ولا يوجد نقص في المعلومات المطلوبة.
جمع البيانات والتحقق من صحتها
#### جمع البيانات (Data Collection)
- تعريف: عملية جمع الحقائق والأرقام والكلمات للمتغيرات المستهدفة وتحسينها.
- أهميتها: من أهم مراحل الدراسة لظاهرة معينة.
- متطلباتها: فهم عميق للمعلومات، تخطيط، وعمل دؤوب للحصول على بيانات عالية الجودة.
- أجهزة الجمع: المستشعرات (مثل: مستشعرات درجة الحرارة، مستشعرات الرياح، مقاييس المطر، مقاييس الرطوبة) ومسجلات البيانات.
- مثال تطبيقي (الطقس): جمع قيم درجة الحرارة، سرعة الرياح، ومعدل هطول الأمطار.
#### مصادر البيانات
##### مصادر البيانات الرئيسية (Primary Data Sources)
- تعريف: تحتوي على بيانات لم تُجمع من قبل.
- أمثلة:
- مستشعر درجة الحرارة (يجمع بيانات درجة حرارة الهواء).
- مستشعر سرعة الرياح (يقيس سرعة الرياح).
- استبيان للعملاء حول الطقس المفضل للرحلات.
##### مصادر البيانات الثانوية (Secondary Data Sources)
- تعريف: بيانات تُنتج باستخدام مصادر البيانات الرئيسية.
- مثال: استخدام بيانات درجة الحرارة وسرعة الرياح (مصادر أولية) لحساب درجة حرارة الرياح الباردة باستخدام الصيغة (مصدر ثانوي).
- التصنيف:
-
مصادر داخلية: البيانات التي تُجمع من مستشعر ينتمي إلى الجامعة أو المؤسسة نفسها.
- مصادر خارجية: البيانات التي تُجمع من مؤسسات أخرى أو أفراد خارجيين.
#### التحقق من صحة إدخال البيانات
- تعريف: أي نشاط يتحقق من أن البيانات المدخلة تأتي من مجموعة قيم معتمدة، وتتوافق مع القواعد المقبولة، وقد تتبعها عمليات تصحيحية.
- الهدف: ضمان الدقة والجودة.
- المبدأ: تنفيذ فحوصات لضمان الاتساق المنطقي. البيانات المتوافقة تُقبل، وغير المتوافقة تُرفض.
- مثال: نطاق درجة حرارة الهواء المسموح به من مستشعر: من -88°م إلى 58°م. قيمة مثل 1,000,000,000,000°م تُرفض لأنها تشير إلى خلل.
##### أنواع التحقق من صحة البيانات المدخلة
- التحقق من البحث (Lookup check): تقليل الأخطاء باستخدام قائمة محدودة من القيم المحددة مسبقًا.
- التحقق من التواجد (Presence check): جعل الإدخال إلزامياً في الخلية لضمان عدم تركها فارغة.
- التحقق من الطول (Length check): التأكد من إدخال الرموز والحروف بنطاق طول محدد.
- التحقق من النطاق (Range check): التأكد من وقوع الأرقام المدخلة ضمن نطاق معين (حد أقصى وحد أدنى).
- التحقق من الصيغة (Format check): التأكد من أن البيانات تأتي بصيغة محددة مسبقاً فقط.
- التحقق من النوع (Type check): ضمان إدخال نوع القيمة الصحيح في حقل محدد.
الأهداف التعليمية
المفاهيم
- أنواع البيانات وطرق ترميزها
- جودة المعلومات ومعاييرها
- ماهية التشفير
التطبيق العملي (مايكروسوفت إكسل)
- التحقق من صحة إدخال البيانات
- التنبؤ بالعائد المستقبلي
- استخدام التشفير لحماية البيانات
الأدوات المستخدمة
تدريبات التطبيق
تدريب 1: تحديد الجمل الصحيحة والخطأ
- الهدف: تقييم فهم المفاهيم السابقة.
- المفاهيم المختبرة:
- علاقة علم البيانات بالرياضيات والإحصاء.
- تعريف البيانات.
- تحول البيانات إلى معرفة.
- مصدر المعرفة.
- طرق عرض البيانات.
- أمثلة على ترميز البيانات.
- أهمية جودة المعلومات.
- معايير جودة المعلومات (الدقة، الملاءمة، التوقيت).
تدريب 2: تحويل البيانات إلى معلومات
- الهدف: التطبيق العملي لتحويل البيانات إلى معلومات.
- المطلوب:
- إنشاء قائمة من البيانات.
- تحويلها إلى معلومات مفيدة.
- توضيح كيف يحول الحاسب البيانات إلى معلومات.
تدريب 3: مقارنة البيانات الأولية والمعالجة
- الهدف: فهم الفرق بين البيانات الأولية والمعالجة.
- المطلوب:
- مقارنة بين مجموعة بيانات أولية وبيانات معالجة تصف درجات طالب وأداءه.
- تحديد الأفكار التي يمكن الحصول عليها من كل مجموعة.
تدريب 4: البحث عن مصادر المعلومات وتقييم جودتها
- الهدف: تطبيق معايير جودة المعلومات على مصادر حقيقية.
- المطلوب:
- البحث في الإنترنت عن مواقع تقدم معلومات عن الطقس.
- تحديد معايير الجودة الخمسة في أحد هذه المواقع.
```
نقاط مهمة
- الهدف من التحقق هو ضمان دقة وجودة البيانات المدخلة.
- يتم رفض أي بيانات لا تتوافق مع القواعد المحددة مسبقاً.
- هناك ستة أنواع رئيسية لفحوصات التحقق من الصحة، لكل منها وظيفة محددة.