URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 43491
[ Назад ]

Исходное сообщение
"OpenNews: Завершена работа над FreeBSD портом системы распознавания Cuneiform"

Отправлено opennews , 24-Авг-08 01:11 
Данный проект основан на исходниках, созданных и позднее открытых компанией Cognitive technologies.
Порт (http://www.freshports.org/graphics/cuneiform/) основан на cuneiform-linux (https://launchpad.net/cuneiform-linux) версии 0.3.1 и содержит дополнительные исправления из основного репозитория. Работоспособность порта была проверена на FreeBSD 6 и 7, архитектуры i386 и amd64.


OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в HTML формате с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).


URL: http://www.freshports.org/graphics/cuneiform/
Новость: http://www.opennet.me/opennews/art.shtml?num=17523


Содержание

Сообщения в этом обсуждении
"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено Michael Shigorin , 24-Авг-08 01:11 
Молодцом :-)

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 24-Авг-08 01:44 
стараемся. Щас пытаюсь понять как заставить движок распозновать картинки и таблицы. Код не документирован, да и понимания того как это все работает не хватает, наверное надо будет пойти в гиблиотеку за соотв. литературой. Интересна позиция авторов, они вроде выложили исходники на свой svn, но без доступа к нему, багтрекера и прочих штук, причем исходники еще самые первые, те, которые ничем кроме VC6 не собираются.

Еще интересно было бы получить исходники интерфейса - потому как из примеров совершенно непонятно, например, как получить координаты распознанного символа, что необходимо для написание вменяемой морды.


"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Александр , 24-Авг-08 16:39 
Вот поэтому не очень и хочется копаться в этой жути и отгадывать их загадки. Выдрать бы удачные алгоритмы и похоронить.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 24-Авг-08 18:29 
Все (почти все) алгоритмы популярно описаны в соответствующей литературе, причем как минимум 10 летней давности :))

"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено eve , 24-Авг-08 05:00 
Слов нет, одни звуки. Молодец!

"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено Jay , 24-Авг-08 12:36 
Его бы еще к Kooka прикрутить - это готовый KDE-шный фронтенд для sane и нескольких распознавательных движков.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 24-Авг-08 15:58 
Все портируется в виде API, cli утилита - лишь по сути демка его работы, так что было бы желаение. Но, во первых, пока рано (далеко не все работает ещё), во вторых - лично я KDE не использую.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Аноним , 25-Авг-08 12:53 
> во вторых - лично я KDE не использую.

Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME и т. д. не остануться в стороне.


"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 25-Авг-08 14:16 
>> во вторых - лично я KDE не использую.
>
>Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
>и т. д. не остануться в стороне.

Пока на документирование чего либо совершенно нет времени, тем более что куча функци



"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 25-Авг-08 14:19 
>> во вторых - лично я KDE не использую.
>
>Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
>и т. д. не остануться в стороне.

Пока на документирование чего либо совершенно нет времени, тем более что куча функций не работают или работают некорректно (например, распознование таблиц). В будущем, я думаю что было бы неплохо прикрутить к коду doxygen или другой автогенератор и писать описание функций непосредственно в коде. В данный  момент у меня нет сканера, так что если кто-то хочет commandline sane OCR - то donations are welcome :) GUI писать не буду - нет времени и опыта, а вот CLI сканер с libsane - смог бы.



"хм"
Отправлено raven428 , 25-Авг-08 09:42 
классно, конечно, но что-то вот эту https://astonshell.com/~raven/pic/test.bmp тестовую картику оно распознать не может:

cuneiform  -l eng -o test.txt test.bmp
Cuneiform for Linux 0.3.1
The image depth is 24 at this point.
Warning: RSL said that the lines do not have to withdraw.

или я что-то не так делаю?


"хм"
Отправлено raven428 , 25-Авг-08 09:43 
да, и uname -a
FreeBSD sandbox.mks-chel.ru 6.2-STABLE FreeBSD 6.2-STABLE #0: Tue Jan 30 11:36:53 YEKT 2007     root@sonata:/usr/obj/.amd_mnt/golf/usr/nfs/src/sys/sonata  i386

"хм"
Отправлено raven428 , 25-Авг-08 09:52 
почитал форум проекта, вопрос снят, автор порта тут не причём, это проект такой :-) извините.

"хм"
Отправлено Samm , 25-Авг-08 14:30 
>почитал форум проекта, вопрос снят, автор порта тут не причём, это проект
>такой :-) извините.

с warning`ом я уже разобрался и пофиксил, там действительно была проблема порта. А по поволу теста - движок "заточен" и лучше всего работает с файлами 300dpi, если вы сделаете ресайз вашего файла - он будет успешно распознан. Причем внутри движка есть функции для [авто]ресайза картинок, но у меня есть большие сомнения в их корректной работе (причем в принципе, а не в портированной версии). Кроме того resize можно (и нужно, полагаю) делать внутрях libimagemagick, так что если мне будет не лень - я добавлю dpi switch, который будет доступен в imagemagick версии и позволит сканить lowres dpi.

Вообще у меня есть мнение что там большие проблемы c этапом нормализации, но времени на то чтобы как следует в нем разобраться нет + есть ещё много намного более важных проблем.


"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено hhh , 26-Авг-08 18:20 
Хе-хе. Портировано нашим, закоммичено нашим, да и вообще (последние две новости на FreeBSD.org):

New committer: Max Brazhnikov (ports)
Enhanced commit privileges: Stanislav Sedov (src, ports)

тоже наши. Прям гордость берет :)