Loading

أنواع البيانات في مجال الحوسبة


منذ اختراع الحاسوب، أصبحت البيانات جزءًا أساسيًا لا غنى عنه في عالم التكنولوجيا. وقد بدأ الناس باستخدام مصطلح “البيانات” للإشارة إلى المعلومات التي يتم تخزينها أو نقلها عبر أجهزة الكمبيوتر. ومع ذلك، فإن مفهوم البيانات لا يقتصر على هذا التعريف فقط، إذ توجد أشكال متعددة لها. فالبيانات قد تكون نصوصًا أو أرقامًا مدونة على ورق، أو وحدات رقمية مثل “البت” و”البايت” مخزنة في ذاكرة الأجهزة الإلكترونية، أو حتى معلومات محفوظة في ذاكرة الإنسان.



البيانات في الحاسوب هي مجموعة متنوعة من المعلومات التي تُنسّق عادة بطريقة محددة لتُصبح قابلة للمعالجة. وبما أننا أصبحنا نُدرك مفهوم البيانات، فإن البرامج الحاسوبية تُستخدم كمجموعات من التعليمات التي تهدف إلى معالجة هذه البيانات وتحويلها إلى نتائج ذات معنى.


ويُعد علم البيانات من المجالات الحيوية التي تساعد في التعامل مع البيانات بفعالية. يُعرّف علم البيانات بأنه مجال متعدد التخصصات يجمع بين المهارات في الرياضيات، والبرمجة، والمعرفة بالمجال، إلى جانب استخدام الأساليب العلمية، والخوارزميات، والأنظمة لاستخلاص رؤى ومعارف قابلة للتنفيذ من البيانات، سواء كانت منظمة أو غير منظمة. وتُطبَّق هذه المعرفة في مجموعة واسعة من المجالات والتطبيقات العملية.



مع تطور التكنولوجيا، خاصة في مجال الهواتف الذكية، توسعت أنواع البيانات لتشمل النصوص، ومقاطع الفيديو، والصوت، إضافة إلى سجلات النشاط على الإنترنت والسجلات الرقمية الأخرى. ويُصنّف معظم هذا النوع من البيانات على أنه بيانات غير منظمة، نظرًا لعدم توافقها مع نموذج بيانات محدد.


وقد ظهر مصطلح البيانات الضخمة (Big Data) للإشارة إلى كميات هائلة من البيانات التي تُقاس بوحدات مثل البيتابايت أو أكثر. ويُستخدم هذا المصطلح لوصف البيانات التي تتميز بخمس خصائص رئيسية تُعرف بـ”5V’s”:


  • الحجم (Volume)
  • السرعة (Velocity)
  • التنوع (Variety)
  • القيمة (Value)
  • الصدق أو الموثوقية (Veracity)

وفي ظل الانتشار الواسع للتجارة الإلكترونية المعتمدة على الإنترنت، برزت نماذج أعمال تعتمد على البيانات الضخمة كمورد استراتيجي. إذ أصبحت البيانات تُعامل كأصل قيّم يمكن استثماره في خفض التكاليف، وزيادة الكفاءة، وتحسين المبيعات واتخاذ قرارات أكثر دقة.


تجاوز مفهوم البيانات مجرد معالجتها داخل أنظمة الحاسوب، ليشمل مجالات متعددة كعلم البيانات، والتمويل، والصحة، والديموغرافيا، والتسويق. وهذا التنوع أدى إلى اختلاف التعاريف بحسب المجال، وبالتالي تنوّعت الإجابات على سؤال: “ما هي البيانات؟”




البيانات المنظمة هي تلك التي تتبع نموذجًا محددًا مسبقًا يحدد كيفية تسجيل البيانات، وما هي سماتها، وما نوعها، والقيود المفروضة عليها. يسمح هذا التنظيم بإدخال البيانات واسترجاعها وتحليلها باستخدام أدوات الحوسبة بسهولة وكفاءة.



  • الأسماء
  • أرقام الهواتف
  • الأسعار أو العملات
  • الأوزان والارتفاعات
  • إحداثيات المواقع (خط الطول والعرض)
  • عدد الكلمات أو حجم الملف
  • أرقام بطاقات الائتمان
  • أسماء المنتجات أو رموزها
  • معلومات المعاملات

غالبًا ما تُعرض البيانات المنظمة في جداول، حيث تمثل الأعمدة سمات أو متغيرات، وتمثل الصفوف سجلات منفردة. أما تقاطع الصف والعمود – الذي يُعرف بالخليّة – فيحتوي على القيمة المحددة لتلك السمة في السجل المعني.




بخلاف البيانات المنظمة، فإن البيانات غير المنظمة تفتقر إلى نموذج ثابت يمكن للحاسوب قراءته وفهمه تلقائيًا، وغالبًا ما تحتاج إلى تفسير بشري لفهم معناها. على سبيل المثال، عند التعامل مع نصوص طويلة أو مقالات، يمكن لأجهزة الحاسوب قراءة الكلمات والجمل، لكنها لا تستطيع – حتى الآن – إدراك المعنى الكامل أو النبرة المستخدمة دون مساعدة من الإنسان.


ومع تطور التقنيات الحديثة، يسعى علماء البيانات إلى التغلب على هذا التحدي من خلال تطبيقات التعلم الآلي والذكاء الاصطناعي لتحليل هذا النوع من البيانات بشكل أعمق وأكثر دقة.


أمثلة شائعة للبيانات غير المنظمة تشمل:

  • الصور (سواء تم إنشاؤها بواسطة البشر أو الأجهزة)
  • مقاطع الفيديو
  • الملفات الصوتية
  • منشورات وسائل التواصل الاجتماعي
  • التعليقات الإلكترونية
  • الرسائل النصية أو المحادثات عبر الإنترنت



تعتمد أجهزة الحاسوب في تمثيل البيانات – مثل النصوص، والصور، والصوت، والفيديو – على النظام الثنائي، الذي يستخدم رقمي 0 و1. وتُعرف أصغر وحدة من البيانات باسم “بت” (Bit)، والتي تمثل قيمة ثنائية واحدة، بينما يتكوّن البايت (Byte) من ثمانية بتات.


تُقاس سعة التخزين والذاكرة في الحواسيب بوحدات متدرجة مثل:
ميجابايت (MB)، جيجابايت (GB)، تيرابايت (TB)، بيتابايت (PB)، وإكسابايت (EB). ومع الزيادة المستمرة في حجم البيانات التي يُنتجها العالم الرقمي، يواصل علماء البيانات تطوير وحدات قياس جديدة لمواكبة هذا التوسع.



تُخزن البيانات في الحواسيب باستخدام تنسيقات ملفات مختلفة، وقد استخدمت أنظمة الحوسبة المركزية المبكرة أنظمة مثل ISAM وVSAM لإدارة هذه البيانات. كما توجد تنسيقات أبسط وأكثر انتشارًا حاليًا، مثل ملفات CSV (القيم المفصولة بفواصل)، والتي تُستخدم لتخزين البيانات بطريقة قابلة للنقل والمعالجة عبر أنواع مختلفة من الأجهزة.



ومع تطور تكنولوجيا المعلومات، ظهرت أساليب أكثر تقدمًا لتنظيم وتخزين البيانات، تمثلت في قواعد البيانات وأنظمة إدارة قواعد البيانات (DBMS)، ولاحقًا قواعد البيانات العلائقية (RDBMS)، والتي أتاحت إمكانيات أكبر لتنظيم البيانات واسترجاعها بكفاءة وسرعة، وأسهمت في تطوير مجالات تحليل البيانات وإدارتها بشكل ملحوظ.



اترك تعليقاً