کد ts-19773  
عنوان اول طراحی و پیاده سازی نرم افزار تبدیل گفتار به انیمیشن  
نویسنده سحر صالح  
استاد راهنما عبداله چاله‌چاله  
نوع کاغذی  
دانشگاه دانشگاه رازی  
مقطع کارشناسی ارشد  
سال دفاع 1394شمسی  
زبان فارسی  
چکیده بخش عظیمی از مردمان این سرزمین خاکی را جامعه عزیز ناشنوا و کم‌شنوا تشکیل داده‌اند، افرادی با نیازهای خاص که تنها به تازگی مورد توجه تکنولوژی برای برآورد نیازهایشان قرارگرفته‌اند. بازار و تجارت، همواره به دنبال توسعه نرم‌افزاری بوده و هست که بتواند فاصله بین جوامع ناشنوا و غیرناشنوا را تا حد امکان کم کند، به این‌صورت که گفتار را به زبان اشاره تبدیل کند. در جوامع بین‌الملل نرم‌افزارهایی با این قابلیت وجود دارند اما نه تنها آزاد نیستند بلکه باید برای استفاده از آنها قیمت گزافی پرداخت گردد. اما در ایران، چنین نرم‌افزاری برای تبدیل گفتار فارسی به زبان اشاره وجود ندارد. از این‌رو در این پایان‌نامه، برآن شدیم، تا با طراحی و توسعه برنامه‌ای کاربردی، گامی کوچک در جهت کاهش فاصله بین جوامع ناشنوا و غیرناشنوا برداریم. این پروژه دارای دو فاز اصلی است که به طور مجزا به آن‌ها می‌پردازیم. فاز اول تبدیل گفتار ورودی به متن است که با عنوان بازشناسی گفتار شناخته می‌شود و فاز دوم تبدیل کلمات تشخیص داده‌شده به انیمیشن‌های آماده شده به زبان اشاره است. بازشناسی گفتار، موضوعی است که چند دهه اخیر بر روی آن کار شده است و طی مطالعات، ثابت شده است که موفق‌ترین روش آن استفاده از مدل پنهان مارکوف می‌باشد. سیستم تشخیص گفتار استفاده شده در این پایان‌نامه، با بهره جستن از روش مدل پنهان مارکوف نیز خود دارای دو فاز آموزش و آزمون است. ابتدا برای تمامی کلمات پایگاه‌داده یک مدل پنهان مارکوف طراحی شده و برچسب‌گذاری می‌شود، که این همان فاز آموزش است. در فاز آزمون برای گفتار پیوسته، ابتدا جمله شکسته و کلمات استخراج می‌شود و با عبور از تمامی مدل‌های موجود، بهترین تطبیق یافت می‌شود. سپس، برای دنباله کلمات پیش‌بینی شده، انیمیشن زبان اشاره معادل آن، پخش می‌شود. ارزیابی روش پیشنهادی و پیاده‌سازی شده بر روی پایگاه‌داده شخصی ایجاد شده، انجام می‌‌گردد. این پایگاه‌داده متشکل از 90 کلمه مجزا که کلمات تشکیل دهنده جملات کاربردی در یک محیط درمانی هستند، می‌باشد. تمامی کلمات و جملات با تکراهای مختلف به منظور آموزش و بررسی کارایی سیستم ضبط و نگهداری شده‌اند. سیستم پیاده‌سازی شده، بر روی پایگاه‌داده آماده شده وابسته به گوینده و بدون نویز، به صورت آفلاین، به طور میانگین برای کلمات مجزا با دقت حدود 92% و برای جملات با دقت 89% درستی عمل می‌کنند.
 
تاریخ ثبت در بانک 6 خرداد 1397