سوال:
میراث کی منتقلی میں دستی اعداد و شمار کے اندراج کے بعد سے مشین سیکھنے کے ل data ڈیٹا سکریپنگ کس طرح سب سے زیادہ محنت کش کی رکاوٹ بن گئی ہے؟
A:مشین لرننگ (ایم ایل) پروجیکٹ شروع کرنے کی کوشش کرتے وقت کمپنیاں جن عملی پریشانیوں کا سامنا کرسکتی ہیں ان میں سے ایک ابتدائی تربیتی ڈیٹا سیٹ کو حاصل کرنے کا چیلنج ہے۔ اس میں محنت سے متعلق عمل شامل ہوسکتے ہیں جیسے ویب سکریپنگ یا دیگر ڈیٹا سکریپنگ۔
ویب سکریپنگ اور ڈیٹا سکریپنگ کی اصطلاحات بڑے پیمانے پر کمپیوٹر سافٹ ویئر کے ذریعہ خود کار سرگرمی کا حوالہ دیتی ہیں ، لیکن بہت سے ایم ایل پروجیکٹس کے لئے ، ایسے معاملات پیش آرہے ہیں جہاں کمپیوٹر کو صحیح ٹارگٹ ڈیٹا اکٹھا کرنے کی تدبیر نہیں ہے ، لہذا یہ کرنا پڑے گا۔ "ہاتھ سے." اس کو آپ "ہیومن ویب / ڈیٹا سکریپنگ" کہہ سکتے ہیں ، اور یہ ایک بے شک کام ہے۔ اس میں عام طور پر ٹریننگ سیٹس کے ذریعہ ایم ایل پروگرام کو "فیڈ" کرنے کے لئے ڈیٹا یا تصاویر کی تلاش کرنا شامل ہے۔ یہ اکثر خوبصورت تکرار ہوتا ہے ، جس کی وجہ سے یہ تکلیف دہ ، سست ، کام کا مطالبہ کرتا ہے۔
مفت ڈاؤن لوڈ: مشین سیکھنا اور اس سے کیوں فرق پڑتا ہے |
ایم ایل ٹریننگ سیٹوں کے ل Data ڈیٹا سکریپنگ مشین سیکھنے میں ایک منفرد پریشانی کی راہ میں حائل رکاوٹ کی نمائندگی کرتی ہے ، جزوی طور پر اس وجہ سے کہ دوسرے کام کا زیادہ حصہ نہایت ہی تصوراتی ہے اور بار بار نہیں۔ بہت سے لوگ ایک نئی ایپ کے ل a ایک عمدہ آئیڈیا لے کر آسکتے ہیں جو مشین لرننگ کے کام انجام دیتے ہیں ، لیکن گری دار میوے اور بولٹ اور عملی کام بہت مشکل ہوسکتا ہے۔ خاص طور پر ، تربیتی سیٹ جمع کرنے کے کام کو تفویض کرنا دراصل ایم ایل منصوبے کا سب سے مشکل حص ofہ ہوسکتا ہے ، جیسا کہ مائک جج کے "سلیکن ویلی" ٹی وی شو میں مکمل طور پر تلاش کیا گیا ہے۔ ایک سیزن چار ایپیسوڈ میں ، ایک اسٹارٹ اپ انٹرپرینیور پہلے ساتھی کو مزدوری سے متعلق کام کرنے کی طرف راغب کرتا ہے ، پھر اسے کالج کے طلباء کو ہوم ورک اسائنمنٹ کی طرح بھیجی بنا کر گزرنے کی کوشش کرتا ہے۔
یہ مثال معلم ہے کیونکہ اس سے ظاہر ہوتا ہے کہ دستی اعداد و شمار کو ختم کرنا کتنا ناپسند اور بظاہر غیر اہم ہے۔ تاہم ، یہ بھی ظاہر کرتا ہے کہ مشین سیکھنے کی مصنوعات کی وسیع رینج کے لئے یہ عمل ضروری ہے۔ اگرچہ زیادہ تر لوگ اعداد و شمار کے اندراج سے نفرت کرتے ہیں ، لیکن تربیت کے سیٹوں کو کسی نہ کسی طرح سے جمع کرنا ہوتا ہے۔ اس عمل سے متعلق ماہرین اکثر ویب کھرچنے والی خدمت استعمال کرنے کی تجویز کرتے ہیں۔ بنیادی طور پر محنتی کاموں کو بیرونی جماعتوں کے لئے صرف اس کام کا آؤٹ سورس کرنا ، لیکن اس سے سیکیورٹی کی خرابی پیدا ہوسکتی ہے اور اس سے دیگر مسائل پیدا ہوسکتے ہیں۔ دستی ڈیٹا اکٹھا کرنے کے کام کو گھر میں رکھتے وقت ، ایک بار پھر ، ایک دستی اور وقت طلب عمل جو اکثر ہوتا ہے اس کے لئے بھی کوئی بندوبست کرنا ہوگا۔
کچھ طریقوں سے ، مشین سیکھنے کے ل "" ہیومن ڈیٹا سکریپنگ "دستی اعداد و شمار کے اندراج کی طرح لگتا ہے جو کبھی کبھی میراث کی منتقلی میں کرنا پڑتا ہے۔ جب بادل زیادہ سے زیادہ مقبول ہوتا گیا ، اور کمپنیوں نے اپنے عمل اور کام کے بہاؤ کو بادل میں ڈال دیا ، کچھ نے محسوس کیا کہ انہوں نے عملی طور پر یہ کام نہیں کیا ہے کہ کس طرح ان کے کارپوریٹ ڈیٹا کو الگ تھلگ میراثی نظام سے کلاؤڈ آبائی ایپلی کیشنز میں حاصل کیا جاسکتا ہے۔ نتیجے کے طور پر ، کچھ لوگ جو دوسری صورت میں ڈیٹا سائنسدان تھے یا آئی ٹی کی ضروری مہارت رکھنے والے تخلیقی لوگ اپنے آپ کو ڈیٹا انٹری کے ناخوشگوار کام کرتے پایا۔
مشین سیکھنے میں بھی ایسا ہی ہونے کا امکان ہے۔ آپ کسی ڈیٹا سائنس دان کو یہ شکایت کرتے ہوئے سن سکتے ہیں کہ "میں ایک تخلیقی شخص ہوں" یا "میں ترقی کی طرف ہوں"۔ لیکن کسی کو یہ گھناؤنا کام کرنا پڑتا ہے۔
ایک بار پھر ، اگر تخلیقی رو بہ عمل ورک فلو کے وفد کے عملی جائزے کے مطابق نہیں ہوتا ہے تو ، اس معاملے میں ایک مطابقت پذیری ہوگی کہ ٹاسک ہینڈلنگ کی ہدایت کیسے کی جاتی ہے۔ جب کسی کمپنی میں لوگوں کے پاس ڈیٹا سیٹ جمع کرنے میں ڈیٹا سکریپنگ کا کام کرنے کی ضرورت نہیں ہوتی ہے تو ، اس میں کامیاب منصوبے کے سلسلے میں سلسلہ کا ایک کلیدی حصہ نہیں ہوتا ہے۔ جب بھی کوئی کمپنی اس خیال کو بہتر بنانے کی کوشش کرے گی تو اس کو ذہن میں رکھنے کے قابل ہے جو نئی مشین لرننگ ایپلی کیشنز تیار کرنے کے ارد گرد ہے۔