سوال:
کیوں مشین سیکھنے کے کچھ منصوبوں میں بہت سارے اداکاروں کی ضرورت پڑسکتی ہے؟
A:جب آپ مشین لرننگ کے بارے میں سوچتے ہیں تو ، آپ کمپیوٹر روموں میں کی بورڈز پر کام کرنے والے ہنر مند ڈیٹا سائنسدانوں کے بارے میں سوچتے ہیں۔ مقداری تجزیہ اور الگورتھم پر بہت زیادہ زور دیا جاتا ہے۔ ان میں سے بہت سارے پروگراموں کے لئے حقیقی دنیا کی حقیقی سیاق و سباق کا پورا پورا وجود نہیں ہے - کم از کم ، یہی بات بہت سارے لوگوں کے خیال میں ہوگی۔
تاہم ، آج کے سب سے زیادہ زمینی سازی مشین سیکھنے کے پروگرام سڑکوں پر ، اسٹوروں اور کہیں بھی انسانی اداکاروں کی قابل فہم فوجوں کا استعمال کررہے ہیں کہ وہ چلنے ، کام کرنے یا خریداری جیسے بنیادی انسانی سرگرمیوں کا نمونہ کرسکتے ہیں۔
مفت ڈاؤن لوڈ: مشین سیکھنا اور اس سے کیوں فرق پڑتا ہے |
ٹام سائمونائٹ کا ایک وائرڈ مضمون اس عنوان کو "اے آئی ہوشیار بنانے کے لئے ، انسانوں کو اوڈبال کم ادا شدہ ٹاسک انجام دینے کے لئے" کے عنوان سے بہت اچھی طرح سے واضح کرتا ہے۔
ہول فوڈس گروسری اسٹور میں لی گئی مختصر ویڈیوز کی مثال استعمال کرتے ہوئے ، سائمونائٹ نے اس قسم کے کام پر روشنی ڈالی جس سے مشین لرننگ کے اگلے مرحلے میں سے کچھ کی تعمیر میں مدد ملے گی۔
اس سے یہ سوال پیدا ہوتا ہے کہ یہ سارے افراد مختصر اور آسان ویڈیوز میں اپنے آپ کو فلم بنانے میں کیوں مصروف ہیں جیسے کسی اقدام کو بازو یا ٹانگ میں حرکت دینے کی حیثیت سے ایک ابتدائی کارروائی کی دستاویز کرتے ہیں۔
جواب نے اس پر روشنی ڈالی کہ مشین سیکھنا کہاں ہے اور کہاں جارہی ہے۔
سائمونائٹ لکھتے ہیں کہ ، "محققین اور کاروباری افراد جسمانی دنیا میں اے آئی کو سمجھنا اور ان کا عمل دیکھنا چاہتے ہیں ،" وہ اور دوسرے کیمرے کیوں گھوم رہے ہیں۔ “لہذا کارکنوں کو ضرورت ہے کہ وہ سپر مارکیٹوں اور گھروں میں مناظر ادا کریں۔ وہ دنیا اور اس میں موجود لوگوں کے بارے میں الگورتھم سکھانے کے لئے تدریسی مواد تیار کررہے ہیں۔
جیسا کہ بہت سے ماہرین نشاندہی کریں گے ، مشین لرننگ کے سب سے بڑے محاذوں میں تصویری پروسیسنگ اور قدرتی زبان کی پروسیسنگ شامل ہے۔ یہ انتہائی مقداری طریقہ کار ہیں - دوسرے لفظوں میں ، ان پٹ کی وسیع پیمائش نہیں ہے جیسا کہ "پرفارمنٹ" اصلی دنیا کے ماحول میں ہے۔ اس کے بجائے ، مشین سیکھنے کے پروگرام ماڈل کو بنانے کے لئے انتہائی مخصوص طریقوں سے بصری اور آڈیو ڈیٹا استعمال کررہے ہیں۔ تصویری پروسیسنگ کے ساتھ ، یہ نقطہ نظر (محدود) فیلڈ سے خصوصیات کو چن رہا ہے۔ NLP کے لئے ، یہ فونیز جمع کررہا ہے۔
ان مخصوص ان پٹ زمرے سے آگے جانے میں کچھ ایسی چیز شامل ہوتی ہے جسے آپ "امیج اور اسپیچ گیپ" کہتے ہو۔ تصویری پروسیسنگ اور تقریر کی پہچان جیسی چیزوں سے آگے بڑھ کر ، آپ ان علاقوں میں جا رہے ہو جہاں کمپیوٹر کو مختلف طریقوں سے تجزیاتی ہونا پڑتا ہے۔ تربیتی سیٹ بنیادی طور پر مختلف ہوں گے۔
ویڈیو گرافروں کی فوج درج کریں۔ ان مشینوں کے سیکھنے کے کچھ نئے منصوبوں میں ، انسانی سرگرمیوں کے سب سے چھوٹے خیالات تربیت کے سیٹ ہیں۔ درجہ بندی کے کاموں میں لکھنے والی خصوصیات اور کناروں اور پکسلز کو تلاش کرنے کے لئے تربیت یافتہ ہونے کے بجائے ، کمپیوٹر اس کی بجائے یہ جاننے کے لئے ٹریننگ ویڈیوز استعمال کررہے ہیں کہ مختلف قسم کی کارروائی کیسی دکھائی دیتی ہے۔
کلیدی بات یہ ہے کہ انجینئر اس کوائف کے ساتھ کیا کرسکتے ہیں جب اس کو اکٹھا اور بھاری بھرکم کیا جاتا ہے ، اور جب کمپیوٹر کو اس پر تربیت دی جاتی ہے۔ آپ کو جلد ہی مختلف شعبوں میں نتائج نظر آئیں گے - مثال کے طور پر ، یہ نگرانی کو انتہائی موثر بنائے گا۔ کمپیوٹر بصری شعبے میں "کیا" دیکھ سکیں گے اور لوگ کیا کر رہے ہیں ، اور اس کا اطلاق مارکیٹنگ اور فروخت جیسے شعبوں میں بھی ممکن ہے ، یا کچھ معاملات میں سرکاری ایجنسی کا کام یا مجرمانہ انصاف۔
اس کے نتیجے میں زیادہ سے زیادہ فائدہ اور رازداری سے متعلق سوالوں کے درمیان ہونے والی بحث پر بھی روشنی ڈالی گئی ہے۔ ان ویڈیوز کے زیادہ تر استعمال سے مشین سیکھنے کے ایسے ماڈل تیار ہوں گے جو نگرانی کے لئے کام کرتے ہیں۔ لیکن ان لوگوں کا کیا ہوگا جو سروے نہیں کرنا چاہتے ہیں؟ جب یہ نئے مشین لرننگ پروگرام عوامی جگہ پر تعینات ہیں ، تو فرد کے کیا حقوق ہیں اور وہ لائن کہاں کھینچی جاتی ہے؟
کسی بھی صورت میں ، کمپنیاں مشین سیکھنے کی پیشرفت کے اگلے درجے کے واقعات کو واقعتا dig کھودنے کے ل these اس طرح کے انسانی اور ویڈیو وسائل کا استعمال کر رہی ہیں جس سے کمپیوٹروں کو محض تصاویر کی درجہ بندی کرنے یا فون کے ساتھ کام کرنے کی بجائے ، ان کے آس پاس ہونے والے واقعات کو تسلیم کرنے میں مدد ملے گی۔ تقریر یہ مصنوعی ذہانت میں ایک انتہائی دلچسپ اور متنازعہ ترقی ہے ، اور یہ ایک ایسی چیز ہے جو ٹیک میڈیا اور اس سے آگے اس کی توجہ کا مستحق ہے۔