درباره پروژه
امروزه به لطف پیشرفت تکنولوژی دنیای پیرامون ما با سرعت در حال تغییر است، هوش مصنوعی که تبدیل به نماد این پیشرفت شده، توانسته زندگی بشر را تحت تاثیر قرار دهد و کارها را برایش آسان بگرداند. هوش مصنوعی در تمامی امور زندگی ما وارد شده است، اموری همچون ارتباطات، تلفنهای هوشمند، حمل و نقل (مسافرت درون شهری و برون شهری)، خودروهای خودران، مسیریابی، زندگی دیجیتال، خانههای هوشمند و غیره.همراه شدن با این تغییرات نیاز امروز تمام جوامع بشری است. همانطور که گفته شد یکی از شاخههایی که هوش مصنوعی میتواند در آن تاثیر زیادی بگذارد ارتباطات است. برقراری ارتباط از اولین نیازهای انسان به شمار میآید که امروزه با آمدن تکنولوژی بخصوص اینترنت به امری واجب و فراگیر تبدیل شده و دستگاههای هوشمند سهم زیادی را به خود اختصاص دادهاند. اما این امر برای افرادی که دچار اختلال در گفتار شدهاند تبدیل به چالشی اساسی شده و آنها را در جامعه منزوی کرده است. خوشبختانه هوش مصنوعی برای این چالش راه حلهایی دارد که یکی از این راه حلها موضوع این پژوهش است. تصور کنید اگر این امکان وجود داشت که با همین دستگاههای هوشمند مثل گوشیهای تلفن همراه هوشمند و به کمک فنآوری تشخیص گفتار هوش مصنوعی گفتار بیماران دارای اختلال در گفتار (دیزآرتری) با دقت بالا (بالاتر از دقت انسان) تشخیص داده میشد. چقدر میتوانست در بهبود کیفیت ارتباطات آنها موءثر باشد.
این پروژه تحقیقاتی در راستای ایده و موضوع رساله آقای (رضا افشین مهر) دانشجوی دکتری هوش مصنوعی، شروع به کار کرده است. فرضیه این رساله این است که بتوان با استفاده از تکنولوژیهایی که در ادامه به تعریف برخی از آنها اشاره میکنیم، اقدام به تشخیص گفتار بیماران دیزآرتری و تبدیل آن به متن کرد.
هوش مصنوعی
هوش مصنوعی (AI) شاخهای از علوم کامپیوتر است که به توسعه سیستمها و الگوریتمهایی میپردازد که قادر به انجام وظایفی هستند که بهطور معمول نیاز به هوش انسانی دارند، مانند یادگیری، استدلال، حل مسئله، درک زبان طبیعی، و تشخیص الگوها. این فناوری از روشهای مختلفی مانند یادگیری ماشین، شبکههای عصبی، و پردازش زبان طبیعی بهره میبرد تا سیستمهایی بسازد که بتوانند از دادهها یاد بگیرند، تصمیمگیری کنند، و در محیطهای پیچیده عمل کنند. هوش مصنوعی بهعنوان یکی از تحولات اساسی در علوم و صنایع مختلف شناخته میشود و در حوزههای متعددی مانند پزشکی، خودروسازی، مالی، و ارتباطات تأثیرات عمیقی داشته است.
پردازش زبان طبیعی NLP
پردازش زبان طبیعی (NLP) شاخهای از هوش مصنوعی و زبانشناسی محاسباتی است که به تعامل بین کامپیوترها و زبان انسانی میپردازد. هدف اصلی NLP توسعه الگوریتمها و مدلهایی است که قادر به درک، تفسیر، و تولید زبان طبیعی انسان باشند. این فناوری با استفاده از تکنیکهای مختلف مانند یادگیری ماشین، تحلیل آماری، و شبکههای عصبی به تحلیل و پردازش متون و گفتار میپردازد تا وظایفی مانند ترجمه خودکار، تشخیص گفتار، تحلیل احساسات، و پاسخگویی خودکار را انجام دهد. پردازش زبان طبیعی به طور گسترده در کاربردهایی مانند موتورهای جستجو، دستیارهای صوتی مجازی، تحلیل متن، و سیستمهای ترجمه استفاده میشود و نقش مهمی در تسهیل ارتباط انسان و ماشین دارد.
بازشناسی خودکار گفتار ASR
بازشناسی خودکار گفتار (ASR) فناوریای است که از طریق آن کامپیوترها و دستگاهها قادر به تبدیل گفتار انسان به متن هستند. ASR با استفاده از تکنیکهای پردازش سیگنال صوتی، مدلهای آماری، و الگوریتمهای یادگیری ماشین مانند مدلهای مارکوف مخفی (HMM) و شبکههای عصبی عمیق (DNN) تلاش میکند تا الگوهای صوتی را شناسایی کرده و آنها را به رشتههای متنی معادل تبدیل کند. این فناوری در کاربردهایی مانند دستیارهای صوتی، سیستمهای تشخیص گفتار در خودروها، زیرنویس خودکار، و خدمات مشتریان استفاده میشود و بهبود مداوم آن به افزایش دقت و قابلیتهای تعامل انسان و ماشین کمک میکند.
بیماری دیزآرتری
دیزآرتری گفتاری نوعی اختلال گفتاری حرکتی است که به دلیل ضعف، کندی، یا عدم هماهنگی عضلات دخیل در تولید گفتار به وجود میآید. این اختلال معمولاً به علت آسیب به سیستم عصبی مرکزی یا محیطی رخ میدهد و میتواند نتیجه شرایطی مانند سکته مغزی، آسیب مغزی، بیماری پارکینسون، یا اسکلروز جانبی آمیوتروفیک (ALS) باشد. دیزآرتری ممکن است بر روی وضوح، سرعت، ریتم، و بلندی صدا تأثیر بگذارد، که در نتیجه باعث میشود گفتار فرد مبهم و دشوار برای فهمیدن باشد. درمان دیزآرتری معمولاً شامل توانبخشی گفتاری و استفاده از تکنیکهای جبرانی (مثل همین پژوهش) برای بهبود کیفیت ارتباط است.