با حمایت ستاد فناوری اطلاعات، ارتباطات و میکروالکترونیک معاونت علمی؛
ارتباط بین انسان و ماشین از طریق گفتار به کاربردهای وسیعتری توسعه مییابد
نخستين نرمافزار تايپ گفتاري زبان فارسي بر اساس فناوری تشخیص گفتار پیوسته مستقل از گوینده فارسی طراحیشده و ارتباط بین انسان و ماشین (ازجمله رایانهها) را ممکن ساخته است.
به گزارش مرکز روابط عمومی و اطلاعرسانی معاونت علمی و فناوری ریاست جمهوری، نخستين نرمافزار تايپ گفتاري زبان فارسي با هدف ایجاد ارتباط بین انسان و ماشین (از جمله رایانهها) از طریق گفتار توسط شرکت عصرگویشپرداز طراحی شده است. از طریق این فناوری انسان برای انجام کارهای معمول با ماشینها میتواند بهجای استفاده از کلید و دکمه، با صحبت کردن با ماشین درخواست خود را به آن منتقل کند.
حسین صامتی، عضو هیئت علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف و طراح این نرمافزار در خصوص معرفی نرمافزار نویسا با اشاره به اینکه فعالیت در زمینه هوش مصنوعی و پردازش سیگنال گفتار باهدف ایجاد ارتباط بین انسان و ماشین اجرایی شده است بیان کرد: نویسا علاوه بر بازشناسی گفتار پیوسته و طبیعی فارسی و نوشتن متن معادل آن، براساس شناختی که از مدل زبانی دارد پیشبینی ادامه متن را انجام میدهد و از این طریق دقت تایپ را افزایش میدهد.
صامتی نرمافزار نویسا را شامل دو بخش اصلی توصیف کرد و گفت: نرمافزار تايپ گفتاري زبان فارسي از دو بخش اصلی پردازش گفتار و پردازش زبانی تشکیلشده است، که در پردازش گفتار به بررسی سیگنال گفتار پرداخته میشود و در بخش زبانی کلمات ادا شده ازلحاظ فراوانی، گرامر و معناشناسی مورد بررسی قرار میگیرد که در نهایت متن معادل گفتار به درستی تهیه میشود.
این فعال حوزه فناوری با اشاره به اینکه این نرمافزار در سال ۸۶ برای اولین بار در دنیا توسط محققان داخلی طراحی شده است گفت: شرکت عصرگویش پرداز پیشرو در طراحی نرمافزار تبدیل گفتار به متن فارسی در جهان بود ولی در حال حاضر شرکتهایی همچون گوگل و چندین شرکت داخلی برای زبان فارسی این سامانه را ارائه کرده¬اند که هیچیک امکان بازشناسی متون تخصصی را ندارند.
وی گفت: نیاز به این سامانه از زمانهای دور برای انسان وجود داشته است و از دهه ۱۹۸۰ به بعد با فراهم شدن ابزارهای لازم سامانه¬های کاربردی بازشناسی گفتار در جهان ارائه شد.
صامتی با اشاره به مشتریان این نرم افزار در داخل گفت: در حال حاضر بیش از ۳ هزار مشتری اعم از سازمانی و شخصی در کشور از استفادهکنندگان این نرمافزار طراحیشده هستند.
وی در ادامه افزود: بانکها , قوه قضاییه، پزشکان ، وزارت نفت، وزارت ارشاد و دانشجویان از مشتریان این نرمافزار تولیدشده در کشور به شمار میروند.
صامتی تشخیص لهجه و لحن و ایجاد پروفایل شخصی برای تمامی کاربران نرمافزار را از قابلیتهای این نرمافزار خواند و گفت: از مهمترين ويژگيهای نسخه جديد نرمافزار نويسا تولید آن در نسخه¬های مختلف برای کاربریهای مختلف است که از این کاربریها، میتوان به کاربری بیمارستانی، حقوقی، سازمانی و مدارس و نیز برای نویسندگان اعم از فیلمنامهنویس و نویسنده کتاب اشاره کرد که در هر یک از نسخهها با توجه به نیازهای کاربر، تطبیق با واژگان و مدل زبانی آن گروه کاربران صورت گرفته است.
این فعال حوزه فناوری با اشاره به اینکه هیچ تناقضی میان طراحی این نرمافزار و بحث اشتغال وجود ندارد گفت: با توجه به اینکه کار در حوزه فناوریهای نوین همیشه همراه با موضوع اشتغالزایی بوده است نرمافزار طراحیشده ممکن است نیاز به وجود تایپیست را کمرنگتر کند اما طراحی و بهکارگیری این نرمافزار نیازمند گروهی از تحصیلکردگان بهمنظور تحقیق و توسعه است و اشتغالزایی برای نخبگان ایجاد میکند. همچنین پردازش خودکار زبان فارسی، راهگشای انجام پروژه¬های متعدد کاربردی در زمینه خط و زبان فارسی در محیط رایانه خواهد بود که بدون ابزار بازشناسی گفتار چنین کاربردهایی ممکن نبود. کاربردهایی مانند تشخیص تمایل کاربران، مدیریت ارتباط مشتریان از طریق ارتباط صوتی آنان، آمارگیری و تشخیص میزان رضایت کاربران هر سامانه با تبدیل گفتار آنان به متن و تحلیل آن متون عملی خواهد بود و این پروژهها به نوبه خود شغلهای زیادی برای متخصصین و نخبگان ایجاد خواهد کرد.
استفاده در نرمافزارهای آموزشی و بازیها
از فرمانهای صوتی میتوان برای افزایش قابلیتهای جدید به نرمافزارهای مختلف مانند بازیها و نرمافزارهای آموزشی استفاده کرد. گفتاری کردن نرمافزارها، علاوه بر افزودن امکانات جدید به آنها، باعث جذابتر شدن آنها نیز میشود. بهعنوان نمونههایی از این کاربرد، میتوان به نرمافزارهایی که در آنها نیاز به سؤال و جواب وجود دارد (مانند آموزش زبان انگلیسی و آموزش قرآن، نرمافزارهایی با سؤالات چهار جوابی و …) اشاره کرد.
اجرا و کنترل برنامههای رایانه به کمک گفتار
این قابلیت کاربران را قادر می ساز تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرمافزارها را کنترل کنند. بهعنوانمثال، کاربر میتواند با گفتن «به اینترنت وصل شو» یا «اینترنت» مرورگر اینترنت را باز کند و به اینترنت وصل شود. یا با گفتن «اندازه نوشته را بزرگتر کن» یا «بزرگتر» اندازه متن نوشتهشده در ویرایشگر Wordرا بزرگتر کند. بهصورت مشابهی، کاربر میتواند فرمانهای صوتی مختلفی را در نرمافزارهای نصبشده در رایانه تعریف کند و بابیان آنها، نرمافزارها را کنترل کند.
پایان پیام/32
Send to friends