01.04.2025, 13:57

Нейроимплант для перевода мыслей в речь ускорили до режима реального времени — видео

NatNeurosci: потоковый нейроимплант «мозг-голос» озвучивает мысли с ходу

Больная «заговорила» спустя 18 лет молчания благодаря тоненькому как бумажка устройству.

Имплант для чтения мыслей, преобразующий нейронные сигналы в устную речь, позволил женщине с афазией почти мгновенно озвучить то, что она намеревается сказать. Испытания улучшенного нейрочипа описаны в Nature Neuroscience.

Исследователи усовершенствовали интерфейс мозг-компьютер (BCI) с помощью алгоритмов искусственного интеллекта, которые декодируют нейросигналы мысленно произнесенных слов и вокализуют их синтетическим голосом. В отличие от аналогичных устройств предыдущего поколения, которые воспроизводят звук лишь после того, как пользователь заканчивает целое предложение, новинка работает в режиме реального времени с задержкой, не превышающей трех секунд.

Старые BCI, генерирующие речь, похожи на «переписку в WhatsApp», объясняет специалист по вычислительной нейронауке Кристиан Херфф из Маастрихтского университета: «Я пишу предложение, вы пишете предложение, и вам нужно время, чтобы написать следующее... Это просто не похоже на естественный разговор».

BCI, которые транслируют речь в реальном времени, — это «следующий уровень» развития, потому что они позволяют передавать интонацию и акценты, характерные для естественной речи, добавляет он.

Участница исследования Энн потеряла способность говорить после инсульта ствола мозга в 2005 году. Спустя 18 лет ей провели операцию, в ходе которой на поверхность коры поместили тонкий прямоугольник с 253 электродами. Имплант может одновременно записывать активность тысяч нейронов.

Исследователи персонализировали синтетический голос, чтобы он звучал как голос пациентки до болезни, обучив алгоритмы ИИ на записях из ее свадебного видео.

В ходе последнего испытания Энн беззвучно артикулировала 100 предложений из набора в 1024 слова и 50 фраз, появлявшихся на экране. Интерфейс «мозг-голос» фиксировал нейронные сигналы каждые 80 миллисекунд, начиная за 500 миллисекунд до того, как Энн начинала беззвучно произносить предложения. Устройство генерировало от 47 до 90 слов в минуту (естественная речь составляет около 160 слов в минуту).

Эти результаты гораздо лучше по сравнению с предыдущей версией технологии, которую Энн тестировала в более раннем исследовании, а также с ее нынешним устройством для общения, которому требуется более 20 секунд для воспроизведения одного предложения.

BCI неплох в переводе коротких предложений, хотя по сравнению с естественным разговором задержка остается все еще «довольно большой», признает Херфф. По его словам, исследования показывают, что «когда задержка превышает 50 миллисекунд, это начинает серьезно сбивать с толку».

Это только начало, констатирует нейрохирург Эдвард Чанг из Калифорнийского университета в Сан-Франциско. «Но можно представить, что с большим количеством датчиков, большей точностью и улучшенной обработкой сигналов показатели будут только улучшаться», — резюмирует он.

Техника и технологии

Медицина и здоровье