Статья опубликована в № 3207 от 11.10.2012 под заголовком: Персональные технологии: Дракон, который слушает и повинуется

Персональные технологии: Дракон, который слушает и повинуется

Fotolia/PhotoXPress

Я набираю этот текст, не прикасаясь к клавиатуре. Я надиктовываю его в текстовом процессоре на моем ноутбуке, используя программу, позволяющую не только записывать текст с голоса, но и редактировать, форматировать или удалять его.

Текстовым процессором дело не ограничивается – голосом я могу запускать и закрывать программы, давать команды для навигации в интернете, в том числе напрямую переходить к нужным страницам. Можно также создавать и отправлять электронные письма, устанавливать статус в Facebook или Twitter. Все это делает программа Dragon компании Nuance Communications, в моем случае – новейшая версия для компьютеров Macintosh, Dragon Dictate3.

Программа стоит $200, и для работы с ней потребуется некоторая подготовка. Стоит ли покупать ее, если учесть, что Apple недавно оснастила свои компьютеры средством диктовки Siri? У Dragon есть ряд преимуществ. Во-первых, Dragon позволяет с помощью голоса управлять компьютером. Во-вторых, Siri работает лишь при наличии доступа в интернет, а Dragon функционирует автономно.

В принципе, у Dragon очень много функций, но вам в основном потребуются всего две – диктовка и выполнение команд меню. К программе прилагается микрофон с наушником, но можно использовать и другие устройства, включая микрофоны с интерфейсом Bluetooth. Приятно, что версия для Macintosh теперь позволяет расшифровывать надиктованные аудиофайлы, хотя точность распознавания при этом ниже, чем при диктовке в реальном времени.

Чтобы повысить качество распознавания, желательно сначала обучить программу, начитав некоторое количество прилагаемых текстов, – на это уйдет порядка 10 минут. Чтобы дополнительно увеличить словарь программы, можно с ее помощью проанализировать новые тексты, создаваемые вами, к тому же можно добавлять слова или их звуковые аналоги вручную.

Чтобы различить похожие слова, Dragon использует анализ контекста. Программа неплохо справляется с именами собственными, адресами, телефонными номерами и другими трудными фрагментами текстов, хотя тут нередки и ошибки. Впрочем, проблемы с распознаванием встречаются и в простых словах, и для исправления надо либо стирать ошибочный текст и наговаривать правильный заново, либо вызывать меню со списком альтернативных вариантов. Как всегда с программами распознавания, наилучшие результаты получаются при работе в тихом месте. Желательно также произносить сразу целые фразы.

В целом программа может быть весьма полезной, в первую очередь – людям с ограниченными возможностями зрения или тем, кому трудно набирать текст на клавиатуре.

Пока никто не прокомментировал этот материал. Вы можете стать первым и начать дискуссию.
Комментировать