Технологию распознавания речи врачей могут внедрить по всем клиникам

Проект может стоить несколько миллиардов рублей, а эксперты сомневаются в его эффективности
Кажется, что решение надиктовки экономит время, но на практике врачи им не пользуются/ GettyImages

В поликлиниках и больницах могут внедрить технологию голосового заполнения медицинской документации Voice2Med, эта инициатива обсуждается Минздравом и Центром речевых технологий (ЦРТ). Об этом «Ведомостям» рассказал источник, близкий к ЦРТ. Информацию о консультациях Минздрава и ЦРТ подтвердил «Ведомостям» замглавы ведомства Павел Пугачев. «Минздрав готов проанализировать опыт ЦРТ во внедрении решения Voice2Med. Это сейчас обсуждается», – пояснил чиновник.

ЦРТ специализируется на разработке технологий искусственного интеллекта (ИИ), в том числе на распознавании и синтезе речи и компьютерном зрении. Компания разрабатывает несколько десятков технологий по различным направлениям – системы записи телефонных разговоров, речевого оповещения, синтезаторы речи, биометрический доступ и др. В 2019 г. ЦРТ вошел в экосистему «Сбера»: банк тогда выкупил 51% компании у Газпромбанка. После этого банк начал использовать наработки компании в своих сервисах. До середины мая 2022 г. ЦРТ оставался в экосистеме «Сбера», но 17 мая единственным владельцем компании стало АО «Новые возможности», подконтрольное Татьяне Портных.

Представитель ЦРТ отказался от комментариев. В «Сбере» не ответили на запрос «Ведомостей» на момент сдачи материала.

Сервис Voice2Med преобразовывает устную речь в текст, что позволяет в режиме реального времени заполнять медицинские документы. По информации на сайте ЦРТ, система работает на ИИ, используя около десятка словарей различных врачебных специальностей (хирурга, кардиолога, педиатра, рентгенолога и др.). Таким образом врач может больше времени уделять пациенту.

Эксперимент по внедрению решения проводится в нескольких регионах, в том числе в Мордовии, Удмуртии, Мурманской, Кемеровской, Иркутской областях и др. Подключение технологии обходится в несколько миллионов рублей. Например, в декабре 2021 г. ЦРТ заключил контракты на внедрение Voice2Med с минздравом Приморского края на 3 млн руб. и депздравом Ярославской области на 4,3 млн руб. (данные по закупкам опубликованы в базе «СПАРК-Интерфакс»).

Внедрение решения Voice2Med в федеральном масштабе может обойтись системе здравоохранения в несколько миллиардов рублей, считает основатель и совладелец разработчика медицинского ПО Unim Алексей Ремез. Но на федеральном уровне у ЦРТ потенциально появятся и новые конкуренты, считает гендиректор компании – разработчика технологий ИИ для здравоохранения «Третье мнение» Анна Мещерякова. Для сравнения: компаний, занимающихся распознаванием медицинских изображений, только в Москве сегодня более 20, уточняет она.

Технология распознавания речи в медицине очень популярна и активно развивается в мире, но в России внедрение таких технологий не продвигается, говорит руководитель направления цифровой медицины «Инвитро» Борис Зингерман. «Основных причин две, – продолжает эксперт. – Во-первых, англоязычные решения более проинвестированы. Во-вторых, в крупных зарубежных клиниках врачи надиктовывали процесс операции еще 60 лет назад, там этот процесс отлажен. У нас же сами процессы еще не приспособлены».

По словам Зингермана, первые пилотные внедрения технологии были в Москве для УЗИ: «Там это очень востребовано, так как руки заняты и врач надиктовывает описание клинической картины». Но в других направлениях медицины распознавание речи вряд ли приживется, считает он. Качества распознавания медицинских терминов пока недостаточно и поэтому врачу требуется больше времени, чтобы привести распознанную речь в необходимый для медицинского документа формат, поясняет эксперт.

Надиктовка не помогает врачам, соглашается Ремез, им приходится прибегать к машинописному вводу информации. «Есть области, где надиктовка возможна, – объясняет он. – Например, патологоанатомам подобные технологии действительно могут пригодиться. Но не понятно, что в данном случае будет дешевле». По словам Ремеза, системы распознавания речи пока что не умеют формировать стандартизированный файл из распознанной речи, а запись врачебного осмотра или протокола операции требует стандартизированного ввода по полям. «Кажется, что решение надиктовки экономит время, но на практике врачи им не пользуются, так как оно только тормозит работу», – заключает он.