University of Illinois (UIUC) spolupracuje s Applem a dalšími technologickými giganty na projektu Speech Accessibility Project, jehož cílem je zlepšit systémy rozpoznávání hlasu pro lidi s řečovými vzory a handicapy, kterým současné verze nerozumí. Systémy rozpoznávání hlasu pro digitální asistenty, jako je Siri, se často vysmívají za to, že špatně slyší požadavek uživatele, v průběhu let se staly přesnějšími, včetně vývoje rozpoznávání na zařízení. Novým krokem je projekt, jehož cílem je dále zvýšit přesnost tím, že se zaměřuje na lidi s vadami řeči a postižením.
Intenzivně se pracuje na zdokonalení technologie
Projekt UIUC Speech Accessibility Project se ve spolupráci s Apple, Amazon, Google, Meta a Microsoft, stejně jako s neziskovými organizacemi, pokusí rozšířit škálu řečových vzorů, kterým mohou systémy rozpoznávání hlasu porozumět. To zahrnuje zaměření na řeč postiženou nemocemi a postiženími, včetně Lou Gehrigovy choroby, amyotrofické laterální sklerózy, Parkinsonovy choroby, dětské mozkové obrny a Downova syndromu.
V některých případech by systémy rozpoznávání řeči mohly poskytnout zlepšení kvality života uživatelům s onemocněními, které brání pohybu, ale problémy ovlivňující hlas uživatele mohou ovlivnit jeho účinnost.
V rámci projektu zpřístupnění řeči budou shromážděny vzorky od jednotlivců „představujících rozmanitost řečových vzorů“, aby se vytvořila soukromá a neidentifikovatelná datová sada. Tato datová sada, která se nejprve zaměří na americkou angličtinu, by pak mohla být použita k trénování modelů strojového učení, aby se lépe vypořádaly s řečí.
Zapojení široké škály technologických společností, které mají virtuální asistenty nebo nabízejí funkce rozpoznávání řeči ve svých nástrojích, by mohlo pomoci urychlit vývoj v rámci projektu. Namísto použití samostatných týmů, které by mohly duplikovat výsledky nalezené ostatními, mohou týmy místo toho spolupracovat přímo prostřednictvím projektu.
„Hlasová rozhraní by měla být dostupná všem, a to včetně lidí s postižením,“ řekl Mark Hasegawa-Johnson, profesor na UIUC. „Tento úkol byl obtížný, protože vyžaduje velkou infrastrukturu, ideálně takovou, kterou mohou podporovat přední technologické společnosti, takže jsme vytvořili jedinečný interdisciplinární tým s odbornými znalostmi v oblasti lingvistiky, řeči, umělé inteligence, bezpečnosti a soukromí.“