Данный проект основан на исходниках, созданных и позднее открытых компанией Cognitive technologies.
Порт (http://www.freshports.org/graphics/cuneiform/) основан на cuneiform-linux (https://launchpad.net/cuneiform-linux) версии 0.3.1 и содержит дополнительные исправления из основного репозитория. Работоспособность порта была проверена на FreeBSD 6 и 7, архитектуры i386 и amd64.
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в HTML формате с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).
URL: http://www.freshports.org/graphics/cuneiform/
Новость: http://www.opennet.me/opennews/art.shtml?num=17523
Молодцом :-)
стараемся. Щас пытаюсь понять как заставить движок распозновать картинки и таблицы. Код не документирован, да и понимания того как это все работает не хватает, наверное надо будет пойти в гиблиотеку за соотв. литературой. Интересна позиция авторов, они вроде выложили исходники на свой svn, но без доступа к нему, багтрекера и прочих штук, причем исходники еще самые первые, те, которые ничем кроме VC6 не собираются.Еще интересно было бы получить исходники интерфейса - потому как из примеров совершенно непонятно, например, как получить координаты распознанного символа, что необходимо для написание вменяемой морды.
Вот поэтому не очень и хочется копаться в этой жути и отгадывать их загадки. Выдрать бы удачные алгоритмы и похоронить.
Все (почти все) алгоритмы популярно описаны в соответствующей литературе, причем как минимум 10 летней давности :))
Слов нет, одни звуки. Молодец!
Его бы еще к Kooka прикрутить - это готовый KDE-шный фронтенд для sane и нескольких распознавательных движков.
Все портируется в виде API, cli утилита - лишь по сути демка его работы, так что было бы желаение. Но, во первых, пока рано (далеко не все работает ещё), во вторых - лично я KDE не использую.
> во вторых - лично я KDE не использую.Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME и т. д. не остануться в стороне.
>> во вторых - лично я KDE не использую.
>
>Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
>и т. д. не остануться в стороне.Пока на документирование чего либо совершенно нет времени, тем более что куча функци
>> во вторых - лично я KDE не использую.
>
>Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
>и т. д. не остануться в стороне.Пока на документирование чего либо совершенно нет времени, тем более что куча функций не работают или работают некорректно (например, распознование таблиц). В будущем, я думаю что было бы неплохо прикрутить к коду doxygen или другой автогенератор и писать описание функций непосредственно в коде. В данный момент у меня нет сканера, так что если кто-то хочет commandline sane OCR - то donations are welcome :) GUI писать не буду - нет времени и опыта, а вот CLI сканер с libsane - смог бы.
классно, конечно, но что-то вот эту https://astonshell.com/~raven/pic/test.bmp тестовую картику оно распознать не может:cuneiform -l eng -o test.txt test.bmp
Cuneiform for Linux 0.3.1
The image depth is 24 at this point.
Warning: RSL said that the lines do not have to withdraw.или я что-то не так делаю?
да, и uname -a
FreeBSD sandbox.mks-chel.ru 6.2-STABLE FreeBSD 6.2-STABLE #0: Tue Jan 30 11:36:53 YEKT 2007 root@sonata:/usr/obj/.amd_mnt/golf/usr/nfs/src/sys/sonata i386
почитал форум проекта, вопрос снят, автор порта тут не причём, это проект такой :-) извините.
>почитал форум проекта, вопрос снят, автор порта тут не причём, это проект
>такой :-) извините.с warning`ом я уже разобрался и пофиксил, там действительно была проблема порта. А по поволу теста - движок "заточен" и лучше всего работает с файлами 300dpi, если вы сделаете ресайз вашего файла - он будет успешно распознан. Причем внутри движка есть функции для [авто]ресайза картинок, но у меня есть большие сомнения в их корректной работе (причем в принципе, а не в портированной версии). Кроме того resize можно (и нужно, полагаю) делать внутрях libimagemagick, так что если мне будет не лень - я добавлю dpi switch, который будет доступен в imagemagick версии и позволит сканить lowres dpi.
Вообще у меня есть мнение что там большие проблемы c этапом нормализации, но времени на то чтобы как следует в нем разобраться нет + есть ещё много намного более важных проблем.
Хе-хе. Портировано нашим, закоммичено нашим, да и вообще (последние две новости на FreeBSD.org):New committer: Max Brazhnikov (ports)
Enhanced commit privileges: Stanislav Sedov (src, ports)тоже наши. Прям гордость берет :)