درباره پروژه

امروزه به لطف پیشرفت تکنولوژی دنیای پیرامون ما با سرعت در حال تغییر است، هوش مصنوعی که تبدیل به نماد این پیشرفت شده، توانسته زندگی بشر را تحت تاثیر قرار دهد و کارها را برایش آسان بگرداند. هوش مصنوعی در تمامی امور زندگی ما وارد شده است، اموری همچون ارتباطات، تلفن‌های هوشمند، حمل و نقل (مسافرت درون شهری و برون شهری)، خودروهای خودران، مسیریابی، زندگی دیجیتال، خانه‌های هوشمند و غیره.همراه شدن با این تغییرات نیاز امروز تمام جوامع بشری است. همانطور که گفته شد یکی از شاخه‌هایی که هوش مصنوعی می‌تواند در آن تاثیر زیادی بگذارد ارتباطات است. برقراری ارتباط از اولین نیازهای انسان به شمار می‌آید که امروزه با آمدن تکنولوژی بخصوص اینترنت به امری واجب و فراگیر تبدیل شده و دستگاه‌های هوشمند سهم زیادی را به خود اختصاص داده‌اند. اما این امر برای افرادی که دچار اختلال در گفتار شده‌اند تبدیل به چالشی اساسی شده و آن‌ها را در جامعه منزوی کرده است. خوشبختانه هوش مصنوعی برای این چالش راه حل‌هایی دارد که یکی از این راه حل‌ها موضوع این پژوهش است. تصور کنید اگر این امکان وجود داشت که با همین دستگاه‌های هوشمند مثل گوشی‌های تلفن همراه هوشمند و به کمک فنآوری تشخیص گفتار هوش مصنوعی گفتار بیماران دارای اختلال در گفتار (دیزآرتری) با دقت بالا (بالاتر از دقت انسان) تشخیص داده می‌شد. چقدر می‌توانست در بهبود کیفیت ارتباطات آن‌ها موءثر باشد.

این پروژه تحقیقاتی در راستای ایده و موضوع رساله آقای (رضا افشین مهر) دانشجوی دکتری هوش مصنوعی، شروع به کار کرده است. فرضیه این رساله این است که بتوان با استفاده از تکنولوژی‌هایی که در ادامه به تعریف برخی از آنها اشاره می‌کنیم، اقدام به تشخیص گفتار بیماران دیز‌آرتری و تبدیل آن به متن کرد.

هوش مصنوعی

هوش مصنوعی (AI) شاخه‌ای از علوم کامپیوتر است که به توسعه سیستم‌ها و الگوریتم‌هایی می‌پردازد که قادر به انجام وظایفی هستند که به‌طور معمول نیاز به هوش انسانی دارند، مانند یادگیری، استدلال، حل مسئله، درک زبان طبیعی، و تشخیص الگوها. این فناوری از روش‌های مختلفی مانند یادگیری ماشین، شبکه‌های عصبی، و پردازش زبان طبیعی بهره می‌برد تا سیستم‌هایی بسازد که بتوانند از داده‌ها یاد بگیرند، تصمیم‌گیری کنند، و در محیط‌های پیچیده عمل کنند. هوش مصنوعی به‌عنوان یکی از تحولات اساسی در علوم و صنایع مختلف شناخته می‌شود و در حوزه‌های متعددی مانند پزشکی، خودروسازی، مالی، و ارتباطات تأثیرات عمیقی داشته است.

پردازش زبان طبیعی NLP

پردازش زبان طبیعی (NLP) شاخه‌ای از هوش مصنوعی و زبان‌شناسی محاسباتی است که به تعامل بین کامپیوترها و زبان انسانی می‌پردازد. هدف اصلی NLP توسعه الگوریتم‌ها و مدل‌هایی است که قادر به درک، تفسیر، و تولید زبان طبیعی انسان باشند. این فناوری با استفاده از تکنیک‌های مختلف مانند یادگیری ماشین، تحلیل آماری، و شبکه‌های عصبی به تحلیل و پردازش متون و گفتار می‌پردازد تا وظایفی مانند ترجمه خودکار، تشخیص گفتار، تحلیل احساسات، و پاسخگویی خودکار را انجام دهد. پردازش زبان طبیعی به طور گسترده در کاربردهایی مانند موتورهای جستجو، دستیارهای صوتی مجازی، تحلیل متن، و سیستم‌های ترجمه استفاده می‌شود و نقش مهمی در تسهیل ارتباط انسان و ماشین دارد.

بازشناسی خودکار گفتار ASR

بازشناسی خودکار گفتار (ASR) فناوری‌ای است که از طریق آن کامپیوترها و دستگاه‌ها قادر به تبدیل گفتار انسان به متن هستند. ASR با استفاده از تکنیک‌های پردازش سیگنال صوتی، مدل‌های آماری، و الگوریتم‌های یادگیری ماشین مانند مدل‌های مارکوف مخفی (HMM) و شبکه‌های عصبی عمیق (DNN) تلاش می‌کند تا الگوهای صوتی را شناسایی کرده و آن‌ها را به رشته‌های متنی معادل تبدیل کند. این فناوری در کاربردهایی مانند دستیارهای صوتی، سیستم‌های تشخیص گفتار در خودروها، زیرنویس خودکار، و خدمات مشتریان استفاده می‌شود و بهبود مداوم آن به افزایش دقت و قابلیت‌های تعامل انسان و ماشین کمک می‌کند.

بیماری دیزآرتری

دیزآرتری گفتاری نوعی اختلال گفتاری حرکتی است که به دلیل ضعف، کندی، یا عدم هماهنگی عضلات دخیل در تولید گفتار به وجود می‌آید. این اختلال معمولاً به علت آسیب به سیستم عصبی مرکزی یا محیطی رخ می‌دهد و می‌تواند نتیجه شرایطی مانند سکته مغزی، آسیب مغزی، بیماری پارکینسون، یا اسکلروز جانبی آمیوتروفیک (ALS) باشد. دیزآرتری ممکن است بر روی وضوح، سرعت، ریتم، و بلندی صدا تأثیر بگذارد، که در نتیجه باعث می‌شود گفتار فرد مبهم و دشوار برای فهمیدن باشد. درمان دیزآرتری معمولاً شامل توانبخشی گفتاری و استفاده از تکنیک‌های جبرانی (مثل همین پژوهش) برای بهبود کیفیت ارتباط است.