فہرست کا خانہ:
تعریف - بگ ڈیٹا کا کیا مطلب ہے؟
بڑے اعداد و شمار سے مراد وہ عمل ہوتا ہے جب استعمال کیا جاتا ہے جب روایتی ڈیٹا کانوں کی کھدائی اور ہینڈلنگ کی تکنیک بنیادی اعداد و شمار کی بصیرت اور معنی کو ننگا نہیں کرسکتی ہیں۔ ڈیٹا جو غیر اسٹرکچر ہے یا وقت حساس ہے یا بس بہت بڑا ہے رشتہ دار ڈیٹا بیس انجنوں کے ذریعہ اس پر کارروائی نہیں کی جاسکتی ہے۔ اس قسم کے ڈیٹا کو مختلف پروسیسنگ اپروچ کی ضرورت ہوتی ہے جسے بگ ڈیٹا کہتے ہیں ، جو آسانی سے دستیاب ہارڈ ویئر پر بڑے پیمانے پر ہم آہنگی کا استعمال کرتا ہے۔
ٹیکوپیڈیا بگ ڈیٹا کی وضاحت کرتا ہے
بالکل سیدھے الفاظ میں ، بڑا ڈیٹا اس بدلا ہوا دنیا کی عکاسی کرتا ہے جس میں ہم رہتے ہیں۔ جتنی چیزیں تبدیل ہوتی ہیں ، اتنی ہی تبدیلیاں ڈیٹا کے بطور ریکارڈ کی جاتی ہیں اور ریکارڈ کی جاتی ہیں۔ مثال کے طور پر موسم کو لے لو۔ موسم کی پیش گوئی کرنے والے کے ل local ، مقامی حالات کے بارے میں دنیا بھر میں جمع کردہ ڈیٹا کی مقدار کافی ہے۔ منطقی طور پر ، اس بات کا احساس ہوگا کہ مقامی ماحولیات علاقائی اثرات کو مستحکم کرتے ہیں اور علاقائی اثرات عالمی اثرات کو مسترد کرتے ہیں ، لیکن یہ دوسری طرح سے ہوسکتا ہے۔ ایک طرح یا دوسرا ، یہ موسمی اعداد و شمار بڑے اعداد و شمار کی خصوصیات کو ظاہر کرتا ہے ، جہاں بڑے پیمانے پر ڈیٹا کے ل processing ریئل ٹائم پروسیسنگ کی ضرورت ہوتی ہے ، اور جہاں بڑی تعداد میں ان پٹ مشین تیار کی جاسکتی ہے ، ذاتی مشاہدات یا سورج کے مقامات جیسی بیرونی قوتیں۔
اس طرح کی معلومات پر کارروائی سے یہ ظاہر ہوتا ہے کہ کیوں ڈیٹا اتنا اہم ہو گیا ہے:
- اب جمع کردہ زیادہ تر اعداد و شمار غیر منظم ہیں اور اس میں مختلف اسٹوریج اور پروسیسنگ ٹیٹن کی ضرورت ہے جو روایتی رشتہ دار ڈیٹا بیس میں پائے جاتے ہیں۔
- دستیاب کمپیوٹیشنل پاور اسکائی راکٹنگ ہے ، مطلب یہ ہے کہ بڑے اعداد و شمار پر کارروائی کے مزید مواقع موجود ہیں۔
- انٹرنیٹ نے اعداد و شمار کو جمہوری بنادیا ہے ، جس سے دستیاب اعداد و شمار میں مستقل اضافہ ہوتا ہے جبکہ زیادہ سے زیادہ خام ڈیٹا بھی تیار ہوتا ہے۔
اس کی خام شکل میں موجود ڈیٹا کی کوئی قیمت نہیں ہے۔ اعداد و شمار پر عملدرآمد کرنے کی ضرورت ہے تاکہ قیمتی ہو۔ تاہم ، اس میں بڑے اعداد و شمار کا موروثی مسئلہ ہے۔ کیا اعداد و شمار کو آبائی آبجیکٹ کی شکل سے لے کر قابل استعمال بصیرت تک قابل عمل لاگت کے قابل ہے؟ یا کیا اعداد و شمار کے بڑے ٹولوں کے ذریعہ پروسس کرنے کے جوئے کو جائز قرار دینے کے لئے نامعلوم اقدار کے ساتھ بہت زیادہ ڈیٹا موجود ہے؟ ہم میں سے بیشتر اس بات پر متفق ہوں گے کہ موسم کی پیش گوئی کرنے کے قابل ہونے کی قدر ہوگی ، سوال یہ ہے کہ کیا اس قدر سے موسم کے بارے میں تمام اعداد و شمار کو کسی موسم کی رپورٹ میں کچلنے کے اخراجات سے تجاوز کیا جاسکتا ہے۔