Добрый день.
Решил поделиться опытом, по установке и настройке программ для распознавания текста.
Первая из них CuneiForm (свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies) +YAGF (программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm и Tesseract)
команда для установки:
> sudo apt-get install cuneiform yagf
Однако при первом использовании у меня возникла ошибка при открытии файла для распознавания, а точнее программа после выбора изображения, просто вылетала. Большое спасибо ("stas" из #linuxmint-ru) за поиск решения данной проблеммы. Как оказалось необходимо просто в Меню-Правка-Настройки-Обработка изображений- Снять галочку на "Обрезать изображение при загрузке".
Радости не было предела, но не тут то было! 🙂
При добавлении изображения, оказалось, распознавать можно только на английском языке. В меню есть выбор русского или украинского либо русско-английского но после закрытия меню настроек язык все равно перескакивает на английский - такой вот БАГ!!!
На этом решил мои потуги с данной связкой закончить.
Следующим подопытным образцом стала программа GImageReader (GUI Tesseract).
> sudo apt-get install gImageReader tesseract-ocr tesseract-ocr-all
Последний пакет позволяет получить набор всех поддерживаемых языков для GImageReader. Если у Вас ограниченный трафик или нет необходимости в поддержке всех языков, то можно установить на выбор те, которые нужны (например украинский tesseract-ocr-ukr или русский tesseract-ocr-rus).
Устанавливается GImageReader в Меню-Графика. Главное окно имеет вид:
.
В данной программе, имеется возможность, распознавать изображения в основных форматах (jpeg, png и др.), а также документы (pdf многостраничные). Изображения можно повернуть, разбить на блоки (автоопределение структуры), инвертировать цвета, изменить яркость, контрасность, разрешение. Язык распознавания можно выбрать один или несколько.
В целом програмка рабочая, однако до FineReader пока далеко. Я думаю нам простым смертным для повседневных задач может иногда пригодится и облегчит труд.