دانلود مقاله روش جدید برای لب‌خوانی با استفاده از پردازش تصویر

Word 800 KB 18379 19
مشخص نشده مشخص نشده کامپیوتر - IT
قیمت قدیم:۱۰,۱۵۰ تومان
قیمت: ۷,۸۰۰ تومان
دانلود فایل
  • بخشی از محتوا
  • وضعیت فهرست و منابع
  • بازشناسی تصویری گفتار به عنوان فرآیندی برای کمک به افرادی که دچار آسیب در سیستم صوتی شده‌اند، در سالهای اخیر مورد توجه محققین قرار گرفته‌ است. در این مقاله سعی در این بوده که سه روش برای استخراج ویژگی شکل لب ارائه شود : استخراج کانتور لب ، قطعه‌بندیWatershed ، پارامترهای پویانمایی چهره . سپس برای شناسایی گفتار از روی حرکات لب از الگوریتم HMM و شبکه‌های عصبی پرسپترون دولایه با ساختاری ساده استفاده شده است.
    سامانه‌ی لب‌خوانی رایانه‌ای به معلولینی کمک می کند که دچار آسیب در سیستم صوتی بوده و قادر به برقراری ارتباط با دیگران نیستند. این افراد معمولا توانایی انجام صحیح حرکات لب به شکلی که برای تکلم لازم است را داشته و در حالت ایده‌آل می‌توان با انجام لب‌خوانی به مقصود آنها پی برد. این نرم‌افزار به معلولینی که از صندلی چرخدار استفاده می‌کنند و فقط توانایی انجام صحیح حرکات لبشان را دارند کمک می‌کند؛ بدین ترتیب که با کمک دوربین فیلمبرداری حرکات لب آنها ثبت می‌شود و پس از آنالیز ، فرامین لازم به ویلچر داده می‌شود.
    از جمله کاربرد های این سامانه می‌توان به تشخیص فرامین ناتوانان گفتاری ،تشخیص برخی کلمات خاص، مکمل بازشناسی گفتار صوتی و همچنین کاربرد‌های نظامی و اطلاعاتی ذکر کرد .در کاربرد حفاظتی ، این سامانه می‌تواند با بهره‌گیری از حرکات لب و بدون ثبت سیگنال صوتی ،کلمات خاصی را شناسایی و تصویر گوینده‌ی آن را در مراکز عمومی و محل‌های تردد ثبت کند.
    فرآیند بازشناسی تصویری گفتار شامل دو مرحله‌ی استخراج ویژگی از دنباله تصاویر لب و طبقه‌بندی ویژگی‌های بدست آمده است. ویژگی گفتاری تصویر حرکات لب معلولین که دارای رنگ پوست و ظاهر متفاوتی هستند ، به کمک طراحی یک الگوریتم جدید استخراج شده و در مرحله‌ی بعد با استفاده از الگوریتم مدل مخفی مارکوف ، حرکات و گفتار تصویری تشخیص داده می‌شود . بهره‌گیری از اطلاعات تصویری از شکل‌های لب و حرکات آن ، دقت و اطمینان سیستم‌های تشخیص اتوماتیک گفتار صوتی را خصوصا در محیط‌های نویزی بطور قابل توجهی بهبود می بخشد .
    آزمایش این نرم‌فزار بر روی مجموعه‌ی دادگان جمع‌آوری شده ،شامل 20 نفر زن و مردِ 20 تا50 سال صورت گرفته و روی 6 واژه گفتاری 1،2،3،4،5،6 با 91درصد موفقیت ، بازشناسی گفتار انجام شده است . این پژوهش‌ها در مراحل تکمیلی می توانند با افزایش تعداد کلماتِ قابل شناسایی ، محدوده‌ی تشخیص را هر چه بیشتر افزایش دهند .

    2- استخراج کانتورلب
    به منظوراستخراج ویژگیهای تصویری مربوط به تولید گفتار،استخراج دقیق شکل لب حیاتی می باشد.استفاده ازرویکردهای مبتنی برلبه برای استخراج لب دارای مشکلات فراوانی می باشد؛ زیرانگاشتهای بدست آمده براساس ویژگی لبه معمولأ دارای نویزواشتباهات فراوانی می باشد. به علاوه لبه هااغلب درمرزلب مفقود بوده یاازنظردامنه خیلی ضعیف هستند.باتوجه به این مشکلات، رویکرد استخراج کانتورلب مابه آشکارسازی لبه هادرلب استناد نکرده است، بلکه هدف ماتقسیم بندی تصاویرلب داده شده به ناحیه لب وغیرلب براساس شدت روشنایی ورنگ پیکسلهامی باشد.دراین روش،فرض نمی شود که لب دارای یک رنگ خاص باشد بلکه جستجو بر اساس تفاوت شدت روشنایی ورنگ بین نواحی لب وغیرلب صورت می گیرد.درادامه درابتدا مدل پیشنهادی باجزئیات شرح داده می شود.سپس تابع هزینه برای پیداکردن بهینه مرزبین ناحیه لب وغیرلب ولگوریتم بهینه سازی پارامترهای مدل توضیح داده می شود.
    3-2- مدل لب
    ازمدلهای انعطاف پذیرهندسی برای مدل کردن شکل لب استفاده شده است .مدل هندسی به شکل لب اجازه می دهد که بوسیله یک مجموعه کوچکی ازپارامترهاباتفسیرفیزیکی توصیف شود. مدل هندسی لب درشکل (1) نشان داده شده است وبامعادلات(1) و(2) توصیف می شود:

پيدايش علوم و فنون جديد، جوامع بشري را با شکلهاي مختلفي از اطلاعات روبرو نموده است. سطح توسعه يک جامعه را مي توان با مقدار اطلاعات و دانش توليد شده در آن ارزيابي کرد. توليد فزاينده اطلاعات به شکلهاي مختلف صورت مي گيرد و با درجات متفاوتي از پيچيدگي ه

1-1 : مقدمه پردازش تصویر دیجیتال[1] دانش جدیدی است که سابقه آن به پس از اختراع رایانه های دیجیتال باز می گردد . با این حال این علم نوپا در چند دهه اخیر از هر دو جنبه نظری و عملی پیشرفت های چشمگیری داشته است . سرعت این پیشرفت به اندازه ای بوده است که هم اکنون و پس از این مدت نسبتاً کوتاه ، به راحتی می توان رد پای پردازش تصویر دیجیتال را در بسیاری از علوم و صنایع مشاهده نمود . ...

با گسترش سيستمهاي چند رسانه اي تحت شبکه شده احساس نياز به امنيت اطلاعات حمايت از کپي رايت در رسانه هاي ديجيتالي مختلف مانند تصوير ، کليپ هاي صوتي ، ويدئو شدت گرفته است. ويکي از روشهاي مناسب جهت رسيدن به اين اهداف ديجيتال واترمارک مي باشد که عبارت اس

سيزهمين کنفرانس مهندسي برق ايران 20-22 ارديبهشت 1384 ترکيب روشهاي مبتني بر مدل و پردازش چندباندي گفتار براي مقاوم سازي بازشناسي گفتار نسبت به نويز بابک ناصرشريف – دانشگاه علم و صنعت ايران Nasser_s@iust.ac.it محمدمهدي همايونپور - دانشگاه صنعت

نشانه چیست؟ «به گفته امبرتو اکو «نشانه تمامی آن چیزهایی است که بر پایه قراردادی اجتماعی و از پیش نهاده، چیزی را به جای چیز دیگری معرفی میکنند. نشانه شناسی نظریه ای است درباره دروغ»[1] «عناصر یک نمایش دراماتیک- از جمله زبان گفتگوها، دکور، حرکت های بازیگران، لباس، چهره آرایی، زیر و بم صدای بازیگران و بسیاری از نشانه های دیگر هر یک به روش خود به پیدایش معنای آن نمایش یاری میرساند. ...

چکیده: هدف از این پژوهش استفاده از نشانه شناسی در فرایند بازیگری، به خصوص کنش وی و بازخورد آن در تاویل کنش توسط مخاطبان میباشد. این مقاله سعی دارد به سوالات زیر پاسخ دهید: 1.درام، برای انتقال پیامهایش از چه نشانه هایی استفاده میکند و تماشاگران چگونه معناهای آن را در می یابند؟ 2.نشانه شناسی چه علمی است و الگوهای کنشی کدامند؟ 3.چگونه میتوان به یک ساختار سه بعدی از کنش دست یافت؟ ...

* چرا در فصل بهار آلرژی شایع است ؟ از علل مهم افزایش حساسیت یا آلرژی فصلی ، گرده های گلها و گیاهان است که در اثر گرده افشانی ایجاد می گردد . گرده افشانی درختان مانند نارون ، گردو ، تبریزی ،‌افرا ، چنار ، زبان گنجشک در اسفند ماه شروع شده که تا اواسط بهار ادامه می یابد ولی علوفه ها از ماههای اردیبهشت و خرداد گرده افشانی می کنند که تا اواسط مرداد ماه ادامه می یابد ولی علفهای هرز در ...

يکي از مباحث مهم در جامعه امروزي که دغدغه بسياري از کارشناسان و همچنين کاربران مي‌باشد بحث امنيت و تشخيص و تاييد هويت است. امروزه در امور مربوط به امنيت اماکني مانند دانشگاه ها، فرودگاه ها، وزارتخانه ها و حتي شبکه‌هاي کامپيوتري استفاده از روش هاي

پیشگفتار: دیرزمانی است که مردم جهان به اهمیت پیدایش خط والفبای آن پی برده، خواسته اندبدانند،کی وکجاوچگونه اختراع شده است.ولی باوجودتحقیقات وآراء مختلف این بحث هنوزبه مرتبه قطعیت نرسیده وتحقیقات همچنان ادامه دارد. باشگفتی مشاهده می کنیم علیرغم دگرگونی ورشدوتحولات خط درطول تاریخ بازهم امروزدرزندگی روزمره ازانواع سیاق های موجوددرطول تاریخ خط،استفاده می شود. سرزمین پهناورایران نیزکه ...

چکیده: شبکه‌های عصبی مصنوعی از مباحث جدیدی است که دانشمندان علوم کامپیوتر به آن علاقمند شده‌اند و برای پیشرفت هرچه بیشتر علوم کامپیوتر وقت و هزینه بسیاری را صرف آن کرده و می‌کنند. این موضوع با ایده گرفتن از سیستم عصبی بدن انسان و با هدف شبیه‌سازی هرچه بیشتر کامپیوتر به انسان شکل گرفت و تا حال به خوبی پیشرفته است. از جمله کاربردهای این بحث می‌توان از شناسایی الگوها, پردازش تصویر ...

ثبت سفارش
تعداد
عنوان محصول