Google, Apple, Meta, Amazon та Microsoft об'єднуються для покращення розпізнавання голосу
Новий проект Speech Accessibility Project об'єднує п'ять технологічних компаній для забезпечення розпізнавання голосу для людей з нестандартними моделями мови. Замість роботи окремо, всі п'ять компаній об'єднують зусилля для покращення розпізнавання голосу.
Компанія Google оголосила, що приєднується до проекту Speech Accessibility, щоб допомогти розробити передові системи розпізнавання мовлення, які можуть задовольнити потреби людей з порушеннями мови.
Розпізнавання мовлення використовується для доступу до веб-сайтів, перекладу мовлення, голосових помічників та управління пристроями.
Але пристроям і службам, які активуються голосом, може бути складно працювати, якщо на мовний патерн користувача впливає, серед іншого, хвороба Лу Геріга, хвороба Паркінсона або синдром Дауна.
Проект спрямований на зміну цієї ситуації шляхом створення проекту, що поєднує п'ять технологічних компаній, які можуть працювати разом, щоб вирішити проблему розпізнавання мови для людей з нестандартними мовними моделями.
Спочатку проект працюватиме з англійською мовою, а потім буде розширено й іншими мовами.
Веб-сайт Speech Accessibility Project пояснив:
«… без різноманітних репрезентативних даних моделі машинного навчання що неспроможні навчитися розуміти різноманітність промови. Цей проєкт спрямований на те, щоб змінити це шляхом створення набору даних, необхідного для більш ефективного навчання цих моделей машинного навчання».
Новий проект щодо розширення доступності
Speech Accessibility Project — це нова програма Університету Іллінойсу та п'яти технологічних компаній, які разом працюють над створенням технології, яка зробить технологію голосової активації доступною для ширшої групи людей.
Наступні компанії є учасниками нової ініціативи:
- Amazon
- Apple
- Meta
- Microsoft
На сайті проекту заявлено проблему, яку вони вирішать:
«Сьогоднішні системи розпізнавання мови, такі як голосові помічники та засоби перекладу, не завжди розпізнають людей з різноманітними мовними моделями, які часто пов'язані з обмеженими можливостями.
Це включає промову, уражену хворобою Лу Геріга або бічним аміотрофічним склерозом, хворобою Паркінсона, церебральним паралічем та синдромом Дауна.
По суті, багато людей у цих та інших спільнотах можуть бути не в змозі скористатися новітніми інструментами розпізнавання мовлення».
Рішення для доступності розпізнавання мови
Проект доступності мови збере зразки різних голосових патернів та створить анонімний набір даних.
Потім цей набір даних використовуватиметься для створення моделей машинного навчання, які зможуть краще зрозуміти різноманітність голосових патернів, які нині недостатньо обслуговуються.
Project Euphonia
У 2019 році Google запустив власну ініціативу доступності на основі IІ під назвою Project Euphonia. Цей проект допоміг Google адаптувати розпізнавання мови, щоб мати можливість розуміти нестандартну розмовну англійську.
В рамках цього проекту було зібрано записи мовних патернів понад 2000 учасників проекту Google.
Одним із вкладів Google у проект доступності мови є спрощення для учасників проекту Euphonia можливості анонімного надання зразків своїх мовних патернів у новий проект доступності.
В оголошенні Google говорилося:
«Ми сподіваємося, що, надавши ці набори даних групам дослідників та розробників, ми зможемо допомогти покращити системи зв'язку для всіх, включаючи людей з обмеженими можливостями.».
Розширене розпізнавання мови
Цей новий проект є важливою віхою у створенні технології, яка може допомогти тим, хто має нестандартний мовний патерн.
Що робить цей новий проект захоплюючим, то це те, що всі п'ять технологічних компаній працюватимуть разом над вирішенням проблем розпізнавання мови, а не працювати окремо.
Поліпшення доступу до пристроїв та Інтернету для недостатньо обслуговуваних спільнот приносить користь усім.