فہرست کا خانہ:
تعریف - ٹیکسٹ اینالٹکس کا کیا مطلب ہے؟
متن کے تجزیات ایک الگ روایت یا پروگراموں کو متن پر متن لگانے کے لئے عام رواج ہے تاکہ اس متن کا تجزیہ کیا جاسکے۔
متن تجزیات کو متن کان کنی کے نام سے بھی جانا جاتا ہے۔
ٹیکوپیڈیا ٹیکسٹ اینالٹکس کی وضاحت کرتا ہے
متن تجزیات کے ساتھ ، کمپیوٹر اعداد و شمار کو پڑھنے کے بجائے اس کی تجزیہ کرتے ہیں۔
ڈویلپرز نے متعدد متعدد متن تجزیاتی الگورتھم تشکیل دیئے ہیں جو متن کے بارے میں معلومات اکٹھا کرنے کے لئے متن میں مختلف چیزیں کرتے ہیں۔ مثال کے طور پر ، قدرتی زبان کی پروسیسنگ میں ٹیکسٹ اینالٹکس بہت اہم رہا ہے ، جہاں پیش قدمی کی پیشرفت کمپیوٹر کی انسانی تقریر کو سمجھنے میں مدد فراہم کرتی ہے۔
کچھ ٹیکسٹ تجزیاتی پروگراموں کے بارے میں بات کرنے کا ایک طریقہ یہ ہے کہ وہ متن سے 'الفاظی الفاظ نکالتے ہیں'۔ سیمنٹک لیبلنگ اس کا ایک حصہ ہے جس سے انسان فطری طور پر متن کو پڑھنے کی اجازت دیتا ہے۔ الفاظ کا استعمال کرنے سے زیادہ سنجیدہ نتیجہ نکل سکتا ہے جس کا تجزیہ کمپیوٹر کے لئے آسان ہے۔
ٹیکسٹ مائننگ یا ٹیکسٹ اینالٹیکس پروگراموں پر گہری نظر ڈالنے کے لئے ، اس طرح کی پروگرامنگ لینگوئج کی نوعیت ، جس میں انسان لکھتے ہیں ، اور مشین لینگوئج ، جو کمپیوٹر پڑھتے ہیں ، کے مابین فرق کو دیکھنے میں مددگار ثابت ہوسکتی ہے۔ ٹیکسٹ اینالٹکس میں کام کرنے کا یہی تصور ہے: مثال کے طور پر ، ایک ٹیکسٹ اینالٹکس پروگرام ٹیکسٹ کے ذریعے جاسکتا ہے اور کسی مخصوص تجزیے اور جملے کو نمبر تفویض کرسکتا ہے تاکہ تجزیات کے انٹرفیس میں استعمال کے لئے حساب کتاب پیش کیا جاسکے ، جس کا تعی humanن انسانی صارفین کے ذریعہ کیا جاتا ہے۔