گھر سافٹ ویئر آواز کی شناخت کی ٹیکنالوجی: مدد گار یا تکلیف دہ؟

آواز کی شناخت کی ٹیکنالوجی: مدد گار یا تکلیف دہ؟

فہرست کا خانہ:

Anonim

کیا آپ نے کبھی کسی کمپنی کو کچھ مدد لینے یا اپنا بل ادا کرنے کے لئے بلایا ہے ، صرف خوشگوار ریکارڈ کی آواز سے ہی آپ کا استقبال کیا جاسکتا ہے جو آپ سے گفتگو کرنا چاہتا ہے - لیکن آپ جو کچھ کہہ رہے ہیں اس کا آدھا حصہ نہیں سمجھ سکتے ہیں۔ یا ہوسکتا ہے کہ آپ کے پاس آئی فون ہے ، اور جب سری پہلی بار ایک اچھے اتحادی کی طرح دکھائی دیتی تھی ، تو آپ کو احساس ہو گیا ہے کہ کبھی کبھی (ٹھیک ہے ، ایماندار بنیں ، اکثر) وہ اسے نہیں مل پاتی ہیں۔ آواز کی شناخت والی ٹیکنالوجی (VRT) ، جسے تقریر سے عبارت بھی کہا جاتا ہے ، ایک عام جال میں پڑتا ہے: اس میں ناقابل یقین حد تک ٹھنڈا ہونے کی صلاحیت ہوتی ہے (اور لڑکے ، کیا ہم اس کی جڑیں کھو رہے ہیں) ، لیکن زیادہ تر یہ دانت پیسنے کی صلاحیت رکھتے ہیں۔ مایوسی میں ورزش.


ایک بار جب یہ خیال سائنس فکشن کے دائرے میں تھا ، آواز کی پہچان 1950 کی دہائی میں ہی شروع ہوچکی ہے ، جب بیل لیبارٹریز آڈری سسٹم کو ایک ہی آواز میں بولے جانے والے ہندسوں کی شناخت کرنے کے لئے ڈیزائن کیا گیا تھا ، اب ہم گفتگو کرتے ہوئے برقی الیکٹرانکس کے جدید نیٹ ورک پر روزانہ کی بنیاد پر - مخلوط نتائج کے ساتھ۔

انسان سے بات کرنے کے لئے ، براہ کرم 0 دبائیں

آج کے بہت سارے کاروباری کسٹمر سروس کالوں کو سنبھالنے کے لئے اب ایسے نظاموں کا استعمال کرتے ہیں جو انٹرایکٹو وائس رسپانس (IVR) کہتے ہیں۔ سب سے عام استعمال صوتی تشریف لے جانے والے مینوز کے لئے ہے ، لیکن کچھ کمپنیاں IVR سسٹم استعمال کرتی ہیں جو صارفین کے اکاؤنٹ کی معلومات تک رسائی حاصل کرسکتی ہیں اور معمولی سوالات کے جوابات دے سکتی ہیں۔ مینو IVR سافٹ وئیر میں عام طور پر ایک محدود ذخیرہ الفاظ ہوتا ہے ، جو "ہاں ،" "نہیں" اور اعداد تک محدود ہوسکتا ہے۔ زیادہ پیچیدہ نظام کمپنی کے مخصوص الفاظ اور جملے کو پہچان سکتے ہیں۔


یہ سسٹم زیادہ مقبول ہورہے ہیں - کم از کم کاروبار کے لئے - ایک عام وجہ کی وجہ سے: وہ قیمتی ہیں۔ وال اسٹریٹ جرنل کی 2010 کی ایک رپورٹ کے مطابق ، ایک عام صارف کی کال جو ایک ایجنٹ تک پہنچتی ہے اس کی لاگت 3 $ اور 9 $ کے درمیان ہوتی ہے ، جبکہ خودکار نظام کے ذریعہ سنبھالنے والی کال کی قیمت صرف پانچ سے سات سینٹ ہوتی ہے۔ اور ، یقینا ، کمپیوٹر پروگرام تھکتے نہیں ہیں ، بیمار ہونے پر کال کرتے ہیں ، یا صارفین سے مایوس نہیں ہوتے ہیں (حالانکہ صارفین یقینی طور پر ان سے مایوس ہوجاتے ہیں)۔


خوش قسمتی سے ، اس کا ہمیشہ یہ مطلب نہیں ہے کہ آئی وی آر لوگوں سے نوکری لے لیتا ہے - یا کم از کم یہ کہ تمام لوگ کال سنٹرز سے غائب ہو رہے ہیں۔ یہ آواز سے متحرک مدد گار کالوں کو ہدایت دینے اور آسان سوالوں کے جوابات دے کر انسانی کسٹمر سروس کے نمائندوں کو زیادہ کارگر ثابت ہونے دیتے ہیں۔


یقینا ان صارفین کے لئے جو ان ٹیکنالوجیز کے ساتھ تعامل کرتے ہیں ، یہ ہمیشہ ہموار سفر نہیں ہوتا ہے۔ آئی وی آر ٹکنالوجی میں عام مسائل جیسے تلفظ کی تکلیف جیسے مسائل کو بہتر بنانے میں ٹکنالوجی میں مدد مل رہی ہے ، لیکن خودکار نظاموں کو ختم کرنا ابھی بھی ایک عام تھیم ہے۔ اس مزاحیہ اسکیٹ کو آواز کی پہچان سے لیس لفٹ کے بارے میں دیکھیں ، جو اس مایوسی کو اجاگر کرتا ہے جس سے آئی وی آر سسٹمز میں خرابی پیدا ہوسکتی ہے۔

ذاتی فون ایپس: سری ، گوگل اب

زیادہ تر لوگ اسمارٹ فونز کے لئے آواز کی پہچان سے واقف ہیں۔ جب کہ جدید ترین فون ماڈل کی اکثریت وی آر کے ساتھ آتی ہے ، ان کی مقبولیت - اور بدنامیاں - اس وقت تیز ہوگئیں جب ایپل نے سری ، معتدل طنزیہ ، آواز سے متحرک "ذاتی معاون" کو آئی فون 4 ایس کے لئے 2011 میں متعارف کرایا۔ گوگل نے جلد ہی ایک سیدھا مقابلہ پیدا کیا: گوگل اب لوڈ ، اتارنا Android جیلی بین OS کے لئے۔ دونوں نظاموں میں خواتین کی آوازیں اور نفیس پہچاننے والی خصوصیات ہیں جو صارفین کو آرام دہ اور پرسکون زبان استعمال کرتے ہوئے اپنے فون پر "بات" کرنے دیتی ہیں۔


لیکن اگرچہ یہ سسٹم اپنے پیش روؤں کے مقابلے میں کافی زیادہ نفیس اور فعال ہیں ، وہ یہ بھی ظاہر کرتے ہیں کہ اس ٹکنالوجی میں ابھی بہت طویل سفر طے کرنا باقی ہے۔ سری کی ناکامی کے بارے میں لطیفے ایک مشہور انٹرنیٹ میم بن چکے ہیں۔ یہاں تک کہ ایک شخص نے سیری کی صلاحیتوں کے بارے میں ایپل پر جھوٹے اشتہار دینے کا مقدمہ بھی چلایا۔


ہوسکتا ہے یہی وجہ ہے کہ جب ایپل نے سری کو اعلی درجے کی اور معلوماتی بننے کے ل created تشکیل دیا ہے تو ، وی آر سافٹ ویئر بھی سسی طرف ہے۔ مثال کے طور پر ، اگر آپ سنہ 1968 کی فلم "2001: A Space Odyssey" - سے سنیما کی تاریخ کی سب سے بدنام زمانہ انٹیلیجنس ٹکنالوجی لائنوں میں سے ایک بولتے ہیں - "پوڈ خلیج کے دروازے کھولیں" - سری مووی سے جواب دینے والی لائن کا جواب دے گی ، " مجھے افسوس ہے (آپ کا نام) ، مجھے ڈر ہے کہ میں ایسا نہیں کرسکتا ، "یا زیادہ طنزیہ ،" ہم انٹیلیجنس ایجنٹ کبھی بھی ایسا نہیں کریں گے ، بظاہر۔ "


آپ کو نام سے پکارنا صرف ان افعال میں سے ہے جو سری کو پیار کرنے میں آسانی پیدا کرنے کی کوشش کرتا ہے ، اور اس سے قدرے زیادہ انسان بن جاتا ہے۔ وی آر اسسٹنٹ صوتی احکامات پر عمل پیرا ہوسکتا ہے ، کال کرنے ، ڈکٹیشن لینے اور ٹیکسٹ بھیجنے ، معلومات کے ل sear انٹرنیٹ کی تلاشی کرنے ، قریبی اسٹورز تلاش کرنے ، ڈرائیونگ ہدایت دینے اور مزید بہت کچھ کرنے کی ضرورت کے بغیر۔ جوابات بیک وقت فون کے ذریعے بولے جاتے ہیں اور اسکرین پر دکھائے جاتے ہیں۔


گوگل ناؤ ، Android جیلی بین پلیٹ فارم کا VR حصہ ، سری سے بہت ملتا جلتا ہے۔ سسٹم اتنی ہی وسیع پیمانے پر شناخت کی صلاحیتوں کو کمانڈ میں ترجمہ کر کے پیش کرتا ہے جس کی مدد سے صارفین کال کرنے ، ٹیکسٹ بھیجنے ، تلاشیاں چلانے ، حساب کتاب اور تبادلوں ، الفاظ کی تعریفیں ، الارم ترتیب دینے ، گانے بجانے اور نقشہ جات اور ہدایات حاصل کرنے دیتے ہیں۔


سری اور گوگل ناؤ جیسے ذاتی آواز کے معاونین کے ساتھ ، فوائد واضح ہیں۔ کال اور ٹیکسٹنگ سے لیکر تلاش اور تفریح ​​تک ہر چیز تیز اور آسان ہے۔ بس اتنا ہی کہیں کہ آپ کیا چاہتے ہیں ، اور (بیشتر وقت) وی آر ایپ آپ کے ل. پکڑ لیتی ہے۔ گاڑی چلاتے وقت وی آر کی ہینڈ آف ٹیکنالوجی خاص طور پر مددگار ثابت ہوتی ہے۔ اور جب بہت سارے لوگوں نے سری کی خرابیوں کو ختم کیا ہے ، اور مصنفین نے یہ استدلال کیا ہے کہ صارفین کی زندگیوں کو بنیادی طور پر چلانے کے لئے گوگل ناؤ کی صلاحیت تھوڑی توہین آمیز ہے ، زیادہ تر لوگ اب بھی محسوس کرتے ہیں کہ یہ مستقبل کی جدید ٹیکنالوجی بہت عمدہ ہے۔


یقینا، سری اور گوگل ناؤ جیسی ذاتی فون ایپس بالکل درست نہیں ہیں - حالانکہ وہ یہ ظاہر کرتی ہیں کہ مستقبل میں اس ٹکنالوجی کو کس مقام پر لایا جاسکتا ہے۔ اس کا مطلب یہ ہے کہ یہاں تک کہ جب سری نے غلط جواب موڑ دیا ، تو ہم اس کو ہنس کر معاف کردیں گے ، یہ جان کر کہ اگلا ورژن اس سے کہیں بہتر ہوگا۔

جہاں وی آر فالس فلیٹ

اگر آپ نے جب کسی کاروبار کو فون کیا ہے تو آپ کو کبھی بھی آئی وی آر کا سامنا کرنا پڑتا ہے ، تو آپ نے مواصلات میں رکاوٹوں کو محسوس کیا ہوگا۔ کچھ پروگرام روبوٹک ٹیکسٹ ٹو اسپیچ صوتی استعمال کرتے ہیں جو الفاظ کو غلط انداز میں پیش کرتے ہیں اور چیزوں کو سمجھنا مشکل بناتے ہیں۔ دوسروں کو حساسیت کی پریشانی ہوتی ہے جس کے نتیجے میں سافٹ ویئر آپ کی باتوں پر عملدرآمد کرنے سے قاصر ہوتا ہے اگر آپ بہت اونچا ، بہت نرم ، یا احتیاط سے اشارہ نہیں کررہے ہیں۔


اس کے علاوہ ، بہت سارے لوگ ابھی بھی کسی مشین سے بات کرنے میں آرام محسوس نہیں کرتے ہیں۔ اگر آپ آئی وی آر پر کچھ تلاشیاں چلاتے ہیں تو ، آپ کو ان فہرستوں کا سامنا کرنا پڑے گا جو لوگوں نے آئی وی آر سسٹم کو نظرانداز کرنے اور "حقیقی شخص" تک پہنچنے کے طریقوں کو ایک ساتھ رکھ لیا ہے۔ یہ حل "آپریٹر کے ل 0 0 دباتے رہیں" سے "مشین کی قسم کھاتے ہیں جب تک کہ وہ انسان کو بازیافت نہیں کرتا ہے۔" اس کے نتیجے میں ، IVR سسٹم میں حالیہ ترقی کا بہت چرچا ان کو انسانوں کے ل more مزید لچکدار بنانے کے ارد گرد گھوما ہے۔ آوازوں کو زیادہ ہمدرد اور کم روبوٹک بنانا ، جس سے نظام تشریف لانا آسان بناتا ہے ، اور فون کرنے والوں کو یہ بتانے دیتا ہے کہ اس ساری چیز کا آغاز سے آخر تک کتنا وقت لگے گا۔ اس سے پتہ چلتا ہے کہ یہاں بہتر ٹیکنالوجی صرف آدھی جنگ ہے۔ باقی آدھے صارفین کو کسی مشین میں بات کرنے کے ساتھ بورڈ میں شامل کیا جا رہا ہے۔

مستقبل کا کیا انعقاد ہے

ان چیلنجوں کے باوجود ، آواز کی شناخت کی ٹیکنالوجی ہر وقت بہتر ہورہی ہے۔ سری اور گوگل ناؤ جیسی ایپلی کیشنز - خامیاں اور سبھی - ان کی کارکردگی میں اب بھی غیر معمولی متاثر کن ہیں ، اور متعدد کمپنیاں وی آر صلاحیتوں کو دوسرے ایپلی کیشنز میں توسیع دے رہی ہیں۔


مثال کے طور پر ، ڈریگن نیچرل اسپیسنگ اسپیکنگ ٹو ٹیکسٹ سافٹ ویئر کے تخلیق کار ، نوانس نے پہلے ہی ٹیلیویژن اور آٹوموبائل کے لئے صوتی کنٹرول تیار کیا ہے ، اور اس ٹکنالوجی کے ورژن کچھ سام سنگ ٹی ویز اور سیور این سی تفریحی نظاموں میں شامل کیے گئے ہیں جو کچھ فورڈ گاڑیوں میں استعمال ہوتے ہیں۔


اور چونکہ گوگل اور ایپل اپنی آواز کو تسلیم کرنے والی ٹکنالوجیوں کے لئے نئے استعمال ڈھونڈتے رہتے ہیں ، اس کا امکان ہے کہ ہم اپنے ٹیلی ویژن سے لے کر اپنے ٹاسٹروں تک ہر طرح کی روزمرہ کی مشینوں سے بات کرتے رہیں گے۔ اور ، ایک بار پھر ، ایسا لگتا ہے جیسے سائنس فکشن ٹھیک تھا۔ ہمیں بس امید کرنی ہوگی کہ وہ ہوشیار مصنفین ایک چیز کے بارے میں غلط تھے۔ اگر یہ مشینیں سنبھال رہی ہیں تو ، اگلی بار جب آپ سری سے "پوڈ خلیج کے دروازے کھولیں" کہیں گے تو آپ کو بہت پریشانی ہو سکتی ہے۔

آواز کی شناخت کی ٹیکنالوجی: مدد گار یا تکلیف دہ؟