Купить нельзя сделать

Как выбрать между самописным и покупным ПО для распознавания текста
Freepik

Спор о том, что лучше – самописное или покупное решение, длится с момента появления ИТ-систем. Подобный выбор рано или поздно встает перед любой компанией, которая собирается автоматизировать рабочие процессы. Оригинальное, самописное решение будет учитывать все потребности заказчика, но готовый «коробочный» продукт всегда дешевле и, как правило, легче интегрируется с распространенными информационными системами. 

Применительно к OCR-системе (optical character recognition) аргументы в пользу «коробочного» и самописного программного обеспечения (ПО) в целом схожие с таковыми при выборе любого другого ПО. «Коробочный» продукт протестирован десятками, а то и сотнями пользователей, а значит, в нем исправлены многие ошибки; его создатели постоянно выпускают обновления и расширения, которые при необходимости можно докупить. 

Наконец, «коробочное» решение на старте работы всегда дешевле. Скажем, годовая лицензия на популярную систему OCR, способную распознавать текст на 198 языках на основе кириллицы, стоит от 6500 руб. Разработка аналогичной программы обойдется в десятки раз дороже. 

Плюсы самописного ПО – собственная техническая поддержка; необходимый и достаточный набор функций; независимость от лицензий и ценовой политики поставщика; наконец, уверенность в отсутствии «бэкдоров» – уязвимостей, которые могут привести к утечке данных. 

По данным, опубликованным на сайте Ассоциации РОСЭУ, в 2022 г. российский рынок OCR-программ составил 6,4 млрд руб., а в 2023 г. он может вырасти до 8 млрд руб. Впрочем, внедрение электронного документооборота (ЭДО) во все сферы жизни может скорректировать этот показатель в меньшую сторону. 

Что, безусловно, является аргументом в пользу покупного OCR. 

Действительно, сейчас даже крупные компании редко предпочитают OCR-системы полностью собственной разработки или написанные с использованием открытого кода. 

«По статистике, такие продукты дают на 15–20% ниже качество распознавания в сравнении, например, с продуктами ABBYY. Сроки создания такого решения большие, ну и сервисная поддержка ложится на силы собственной команды, что не всегда оптимально сказывается на стоимости», – уверяет Василий Мухин, директор направления «электронный документооборот» компании КРОК.

Некоторые компании выбирают гибридный формат – используют как самописные, так и готовые решения или дорабатывают готовые решения дополнительными модулями. О подобном опыте рассказал Александр Воробьев, главный ИТ-архитектор ГК «Альфа-Лизинг»: «Мы используем как самописные решения, так как интегрируем готовое ПО в наш ИТ-ландшафт. Например, нам пришлось разработать свой модуль для подписания документов электронной цифровой подписью через внешних провайдеров ЭДО, поскольку ни один из готовых модулей не мог обеспечить поддержку наших функциональных требований и процессов. Также нам было необходимо решение, которое поддерживалось бы не только нашей внутренней CRM-системой, но и другими. Возможны и гибридные варианты, один из примеров в “Альфа-Лизинге” – система сравнения и распознавания документов. Мы связались с одним из крупнейших игроков на рынке подобных решений, определились с выбором и приобрели SDK (набор инструментов для разработки ПО. – Прим. ред.) с лицензией и enterprise-поддержку и внедрили их в наш самописный модуль, который на основе распознавания и сравнения выдает необходимый результат бизнес-пользователю во внутреннюю CRM-систему».

Для страховки от ухода с рынка поставщика можно использовать механизм депонирования исходного кода. Он предусматривает заключение специального договора, по которому, в случае если компания – производитель ПО прекращает выполнение своих обязательств до указанного срока, подключается третья сторона, у которой имеются исходные коды и они могут быть переданы для нужд поддержки компании – потребителя ПО. Для массовых программ, скажем офисных приложений, такая схема обычно не используется. Но для специальных ИТ-решений этот механизм позволяет обеспечить должную безопасность в случае нарушения поставщиком своих договоренностей. Депонирование является распространенной практикой для многих стран мира, но редко применяется в России. 

«Сейчас наблюдается усиленный переход всего документооборота в цифру, бумаги постепенно в нашей жизни будет становиться все меньше и меньше, соответственно, со временем спрос на системы распознавания, какими бы умными они ни становились, будет постепенно снижаться», – резюмирует Василий Мухин.