فہرست کا خانہ:
تعریف - ویب کان کنی کا کیا مطلب ہے؟
ویب کان کنی ڈیٹا مائننگ تکنیک اور الگورتھم کو ویب سے دستاویزات اور خدمات ، ویب مواد ، ہائپر لنکس اور سرور لاگز سے نکال کر براہ راست ویب سے معلومات نکالنے کے لئے استعمال کرنے کا عمل ہے۔ ویب کان کنی کا مقصد یہ ہے کہ عام طور پر رجحانات ، صنعت اور صارفین کے بارے میں بصیرت حاصل کرنے کے لئے معلومات کو جمع اور تجزیہ کرکے ویب ڈیٹا میں نمونوں کی تلاش کی جائے۔ٹیکوپیڈیا ویب مائننگ کی وضاحت کرتا ہے
ویب کان کنی ڈیٹا مائننگ کی ایک شاخ ہے جو ورلڈ وائڈ ویب پر بنیادی اعداد و شمار کے ذریعہ پر مرکوز ہے ، جس میں ویب کے تمام اجزاء ، سرور کے درمیان موجود ہر چیز پر لاگ ان ہوتا ہے۔ ویب سے منحل کردہ ڈیٹا کے مشمولات ان حقائق کا مجموعہ ہوسکتے ہیں جن کا مطلب ویب صفحات پر مشتمل ہوتا ہے ، اور ان میں متن ، ساختی اعداد و شمار جیسے فہرستیں اور ٹیبلز ، اور یہاں تک کہ تصاویر ، ویڈیو اور آڈیو شامل ہوسکتے ہیں۔
ویب کان کنی کی اقسام:
- ویب مشمولات کی کان کنی - یہ ویب صفحات اور ویب دستاویزات کے مندرجات سے مفید معلومات کی کان کنی کا عمل ہے ، جو زیادہ تر متن ، تصاویر اور آڈیو / ویڈیو فائلیں ہیں۔ اس ضوابط میں استعمال ہونے والی تکنیکوں کو قدرتی زبان پروسیسنگ (NLP) اور معلومات کی بازیافت سے بہت زیادہ کھینچا گیا ہے۔
- ویب ڈھانچے کی کان کنی - یہ گراف تھیوری کے استعمال کے ذریعے کسی ویب سائٹ کے نوڈس اور کنکشن ڈھانچے کا تجزیہ کرنے کا عمل ہے۔ اس سے دو چیزیں حاصل کی جاسکتی ہیں: کسی ویب سائٹ کی تشکیل اس لحاظ سے کہ یہ دیگر سائٹوں سے کس طرح جڑا ہوا ہے اور خود ہی ویب سائٹ کا دستاویز ڈھانچہ ، ہر صفحے کو کس طرح جوڑا جاتا ہے۔
- ویب کے استعمال کی کان کنی۔ یہ صارف کے سرگرمیوں کے بارے میں بصیرت حاصل کرنے کے ل server سرور لاگز سے نمونوں اور معلومات کو نکالنے کا عمل ہے جس میں صارف کہاں سے ہیں ، کتنے سائٹ پر کس آئٹم پر کلک کیا ہے اور سائٹ پر کی جانے والی سرگرمیوں کی نوعیت ہے۔