Разглядеть всё: FineReader против Cuneiform

Когда речь заходит о программах для распознавания символов, практически все русскоязычные пользователи уверенно заявляют: в этом секторе бесплатных альтернатив ABBYY FineReader нет. Но на самом деле с недавних пор выбор есть, ведь российская компания Cognitive Technologies открыла исходные кода своего продукта Cuneiform, сделав его доступным всем и каждому. Сегодня мы столкнём двух гигантов лицом к лицу в попытке выяснить, что же лучше: отрытый код и бесплатность, или коммерческая разработка.

Немного истории
Чтобы лучше понять нынешнее положение дел на рынке OCR-систем, необходимо вспомнить историю рассматриваемых программ.

Оптическое распознавание текста (англ. optical character recognition, OCR) — перевод последовательности изображений символа в последовательность кодов, использующихся для представления в текстовом редакторе. Перевод осуществляется с помощью различных алгоритмов, после преобразования изображения в набор элементарных точек.

По материалам ru.wikipedia.org.

По странному стечению обстоятельств, первые публичные версии обоих программ увидели свет в 1993 году. Именно тогда молодая компания BIT Software (будущая ABBY) выпустила систему распознавания символов FineReader 1.0, а только что созданная Cognitive Technologies выпускает шрифтонезависимую систему распознавания OCR CuneiForm и даже лицензирует её канадской Corel Corporation — для использования в пакете Corel Draw 3.0.

0_5c4e_5e03ae3e_XL

Год спустя ABBY подписывает контракт с Recognita Corp. И начинает распространение FineReader в Европе и США, а также договаривается с компанией «Фитек» о комплектации поставляемых ею сканеров Logitech системой FineReader 2.0 Light.
Год 1996-й ознаменовался выпуском CuneiForm ’96, в которой впервые в мире применены алгоритмы адаптивного распознавания. А ABBY тем временем продала исходный код FineReader компании Samsung Electronics (корейские специалисты использовали этот код при разработке фирменного программного обеспечения для своей продукции).

Адаптивное распознавание — метод, основанный на комбинации двух алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, адаптируясь к конкретным входным символам.

По материалам ru.wikipedia.org.

Дальнейшее развитие обоих систем шло практически параллельно. Однако, в 2004 году Cognitive Technologies практически остановила развитие CuneiForm, тогда как ABBYY продолжает совершенствовать свой продукт по сей день.
После нескольких лет перерыва в разработке, 12 декабря 2007 года Cognitive объявила об открытии исходных кодов своей OCR-системы. Само же открытие состоялось 2 апреля 2008 года. До сего момента, впрочем, сообщество OpenSource не опубликовало ни одной новой версии CuneiForm, сосредоточившись на чистке кода ядра распознавания и подготовке его к портированию на отличные от Windows платформы. Первые версии графических интерфейсов к модифицированному ядру, основанные на библиотеки Qt 4, уже опубликованы для платформы Linux.

На ринг!
В сегодняшнем противостоянии будут участвовать последняя на данный момент Windows-версия CuneiForm 12, доступная на сайте разработчиков (33 Мбайт, OpenSource), а также лицензионная версия ABBY FineReader 9.0 Professional (последняя на данный момент версия — 10.0 — вышла в конце сентября 2009 года и ещё не успела получить широкого распространения).
В ходе тестирования мы изучим функциональные возможности программ, их интерфейсы и — что самое важное — испытаем обоих противников на нескольких документах разной сложности, проверив качество распознавания.

Встречаем по одёжке…
Знакомство с любой программой начинается с интерфейса, ведь даже самая функциональная программа, с которой неудобно работать, растеряет половину своих пользователей.

Главное окно Cuineform 12 (режим редактирования распознанного текста)

Главное окно Cuineform 12 (режим редактирования распознанного текста)

Главное окно FineReader 9.0 (режим разметки и редактирования)

Главное окно FineReader 9.0 (режим разметки и редактирования)

В этом отношении между нашими конкурентами установился паритет — обе программы отличаются достаточно аскетичным интерфейсом, с минимальным набором элементов управления. В плане удобства работы интерфейсы также можно считать равнозначными. Единственный минус CuneiForm — дизайн в стиле давно почившей Windows 98, что может не сильно понравиться пользователям, привыкшим к красотам Vista и Windows 7. У FineReader же не всё идеально с интерфейсом в режиме редактирования документа — большее, чем у конкурента, число функций сказалось не самым лучшим образом.

…и по уму
Обычно по уму провожают, но в нашем случае умом будут считаться заявленные характеристики испытуемых программ.
В этом раунде победу, как ни крути, придётся отдать FineReader — планомерно развиваясь на протяжении последних 5 лет, он успел заметно обогнать конкурента. Впрочем, и возможностей CuneiForm будет более чем достаточно для рядового пользователя. Он умеет открывать графические файлы, принимать изображения со сканера, автоматически производить разметку документа, распознавать таблицы и, конечно же, текст, форматировать распознанный документ в Word-подобном редакторе и экспортировать результаты свое работы в Word и Excel. Единственный существенный недостаток бесплатной программы — невозможность работы с документами в формате PDF.
FineReader в добавок к уже перечисленным функциям умеет работать с PDF (открывать для распознавания и сохранять), получать изображения с цифровых фотокамер, автоматически определять угол наклона распознаваемого документа и очищать изображение от мусора, сохранять результат работы в форматах последних версий Office (docx, xlsx), распознавать штрих-коды и работать на многоядерных процессорах (с соответствующим приростом производительности).

Лицом к лицу
В качестве тестового задания мы использовали несколько образцов разной степени сложности, однако полная картинка открылась уже на самом простом (как нам казалось) тесте. Исходное задание было таким: распознать сфотографированный на цифровую камеру лист формата А4, на котором в два столбца размещался текст, набранный шрифтом Times New Roman кегля 12pt (см. рисунок). Задача усложнялась тем, что текст на изображении был повернут под углом примерно 3 градуса, из-за плохих условий съёмки был немного размыт, а в добавок имелись оптические искажения, вызванные тем, что лист при фотографировании был незначительно изогнут.

Тестовый документ

Тестовый документ

Для CuneiForm распознавание этого документа оказалось задачей почти не разрешимой. Подумав всего 5 секунд, программа выдала результат, в котором действительно правильно было распознано менее 10% слов. Остальное было распознано либо с ошибками, либо превратилось в нечитаемый мусор.
FineReader показал гораздо лучший результат: ни одной ошибки и около двух десятков «сомнительных» символов (почти все они в итоге оказались верными — программа просто перестраховывалась).
Опыт был повторён после небольшой зачистки документа в графическом редакторе: вычищены шумы, увеличена резкость, текст расположен строго горизонтально (при этом символы были немного искажены, поскольку разрешение изображения оставляло желать лучшего).
Такое вмешательство принесло свои плоды: CuneiForm увеличил число правильно распознанных символов примерно до 20%. В случае с FineReader результат практически не изменился.
Дальнейшие опыты только подтвердили первое впечатление: бесплатная программа, увы, устарела и в настоящее время годится лишь для работы с идеально отсканированными документами с достаточно простой структурой. Правда, к её чести стоит сказать, что в текстовый редактор она передаёт документы более корректно (FineReader при передаче описанного выше примера перемудрил с разметкой, в результате чего дальнейшее редактирование документа в OpenOffice Writer превратилось в весьма нетривиальную задачу).

Итого
Во многих областях OpenSource ПО уже давно на равных конкурирует с коммерческими разработками, а кое-где даже постепенно вырывается вперёд. Однако в сфере OCR время массового распространения открытых программ ещё не настало. CuneiForm оправдывает лишь тот факт, что эта система находится на начальной стадии своего OpenSource-пути и у неё всё ещё впереди. А пока пользователям, желающим получать гарантированны результат, по-прежнему придётся платить. И скорее всего их покупкой будет одна из последних версий FineReader.

1 комментарий

  1. От libjournals.info

    Ответить

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *