گھر ڈیٹا بیس ڈیٹا بیس (کے ڈی ڈی) میں علم کی دریافت کیا ہے؟ - ٹیکپوپیڈیا سے تعریف

ڈیٹا بیس (کے ڈی ڈی) میں علم کی دریافت کیا ہے؟ - ٹیکپوپیڈیا سے تعریف

فہرست کا خانہ:

Anonim

تعریف - ڈیٹا بیس (KDD) میں نالج ڈسکوری کا کیا مطلب ہے؟

ڈیٹا بیس میں علم کی دریافت (کے ڈی ڈی) اعداد و شمار کے ذخیرے سے مفید علم کی دریافت کا عمل ہے۔ یہ وسیع پیمانے پر استعمال شدہ ڈیٹا مائننگ تکنیک ایک ایسا عمل ہے جس میں ڈیٹا کی تیاری اور انتخاب ، ڈیٹا کی صفائی ، ڈیٹا سیٹوں پر پیشگی معلومات شامل کرنا اور مشاہدہ شدہ نتائج سے درست حل کی ترجمانی شامل ہے۔

KDD ایپلی کیشن کے اہم علاقوں میں مارکیٹنگ ، فراڈ کا پتہ لگانے ، ٹیلی مواصلات اور تیاری شامل ہیں۔

ٹیکوپیڈیا ڈیٹا بیس (کے ڈی ڈی) میں نالج ڈسکوری کی وضاحت کرتا ہے

روایتی طور پر ، ڈیٹا مائننگ اور علم کی دریافت دستی طور پر کی گئی تھی۔ جیسے جیسے وقت گزرتا گیا ، بہت سسٹم میں ڈیٹا کی مقدار بڑھتی ہوئی ٹیرا بائٹ سائز سے بڑھ جاتی ہے ، اور اب اسے دستی طور پر برقرار نہیں رکھا جاسکتا ہے۔ مزید یہ کہ کسی بھی کاروبار کے کامیاب وجود کے ل data ، ڈیٹا میں بنیادی نمونوں کی دریافت ضروری سمجھی جاتی ہے۔ اس کے نتیجے میں ، چھپے ہوئے ڈیٹا کو دریافت کرنے اور مفروضے بنانے کے لئے کئی سوفٹ ویئر ٹول تیار کیے گئے تھے ، جو مصنوعی ذہانت کا ایک حصہ تشکیل دیتے ہیں۔

کے ڈی ڈی عمل پچھلے 10 سالوں میں اپنے عروج کو پہنچا ہے۔ اس میں اب دریافت کے ل many بہت سے مختلف نقطہ نظر موجود ہیں ، جس میں دلکش تعلیم ، بایسیئن اعدادوشمار ، اصطلاحی استفسار کی اصلاح ، ماہر سسٹم کے لئے علمی حصول اور انفارمیشن تھیوری شامل ہیں۔ آخری مقصد کم سطح کے اعداد و شمار سے اعلٰی سطح کا علم نکالنا ہے۔

کے ڈی ڈی میں کثیر الثباتاتی سرگرمیاں شامل ہیں۔ اس میں ڈیٹا اسٹوریج اور رسائ ، وسیع پیمانے پر ڈیٹا سیٹوں اور الگ الگ نتائج کی ترجمانی کرنے والے الگورتھم اسکیلنگ شامل ہے۔ ڈیٹا کی صفائی اور ڈیٹا تک رسائ کے ڈیٹا گودام میں شامل کےڈی ڈی کے عمل کو آسان بناتا ہے۔ مصنوعی ذہانت تجربہ اور مشاہدات سے تجرباتی قوانین کو دریافت کرکے کے ڈی ڈی کی بھی حمایت کرتی ہے۔ اعداد و شمار میں پہچان جانے والے نمونوں کو نئے اعداد و شمار پر درست ہونا چاہئے ، اور اس میں کچھ حد تک یقینی ہونا چاہئے۔ ان نمونوں کو نیا علم سمجھا جاتا ہے۔ کے ڈی ڈی کے پورے عمل میں شامل اقدامات یہ ہیں:

  1. کے ڈی ڈی عمل کے ہدف کو صارف کے نقطہ نظر سے شناخت کریں۔
  2. اس میں شامل ایپلی کیشن ڈومین اور اس کے بارے میں جاننے والے علم کو سمجھیں
  3. ایک ٹارگٹ ڈیٹا سیٹ یا ڈیٹا نمونوں کا سب سیٹ منتخب کریں جس پر دریافت کی جاتی ہے۔
  4. ضائع شدہ فیلڈز کو سنبھالنے کے ل strate حکمت عملی طے کرکے اعداد و شمار کو صاف اور پہلے سے عبارت بنائیں اور ضروریات کے مطابق ڈیٹا کو تبدیل کریں۔
  5. ناپسندیدہ متغیرات کو ختم کرکے ڈیٹا سیٹ کو آسان بنائیں۔ اس کے بعد ، کارآمد خصوصیات کا تجزیہ کریں جن کا استعمال مقصد یا کام کے لحاظ سے اعداد و شمار کی نمائندگی کرنے کے لئے کیا جاسکتا ہے۔
  6. پوشیدہ نمونوں کی تجویز کرنے کے لئے ڈیٹا مائننگ کے طریقوں سے کے ڈی ڈی اہداف کا مقابلہ کریں۔
  7. پوشیدہ نمونوں کو دریافت کرنے کے لئے ڈیٹا مائننگ الگورتھم کا انتخاب کریں۔ اس عمل میں یہ فیصلہ کرنا شامل ہے کہ مجموعی طور پر کے ڈی ڈی عمل کے لئے کون سے ماڈل اور پیرامیٹرز مناسب ہوسکتے ہیں۔
  8. کسی خاص نمائندگی فارم میں دلچسپی کے نمونوں کی تلاش کریں ، جس میں درجہ بندی کے قواعد یا درخت ، رجعت پسندی اور جھرمٹ شامل ہیں۔
  9. کان کنی کے نمونوں سے ضروری علم کی ترجمانی کریں۔
  10. علم کو استعمال کریں اور اسے مزید کارروائی کے ل it کسی اور نظام میں شامل کریں۔
  11. اس کی دستاویز کریں اور دلچسپی رکھنے والی جماعتوں کے لئے رپورٹ بنائیں۔
ڈیٹا بیس (کے ڈی ڈی) میں علم کی دریافت کیا ہے؟ - ٹیکپوپیڈیا سے تعریف