URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 43491
[ Назад ]

Исходное сообщение
"OpenNews: Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено opennews , 24-Авг-08 01:11

Данный проект основан на исходниках, созданных и позднее открытых компанией Cognitive technologies.
Порт (http://www.freshports.org/graphics/cuneiform/) основан на cuneiform-linux (https://launchpad.net/cuneiform-linux) версии 0.3.1 и содержит дополнительные исправления из основного репозитория. Работоспособность порта была проверена на FreeBSD 6 и 7, архитектуры i386 и amd64.

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в HTML формате с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

URL: http://www.freshports.org/graphics/cuneiform/
Новость: http://www.opennet.me/opennews/art.shtml?num=17523

Содержание

Завершена работа над FreeBSD портом системы распознавания Cuneiform,Michael Shigorin, 01:11 , 24-Авг-08
- Завершена работа над FreeBSD портом системы распознавания Cu...,Samm, 01:44 , 24-Авг-08
  - Завершена работа над FreeBSD портом системы распознавания Cu...,Александр, 16:39 , 24-Авг-08
    - Завершена работа над FreeBSD портом системы распознавания Cu...,Samm, 18:29 , 24-Авг-08
Завершена работа над FreeBSD портом системы распознавания Cuneiform,eve, 05:00 , 24-Авг-08
Завершена работа над FreeBSD портом системы распознавания Cuneiform,Jay, 12:36 , 24-Авг-08
- Завершена работа над FreeBSD портом системы распознавания Cu...,Samm, 15:58 , 24-Авг-08
  - Завершена работа над FreeBSD портом системы распознавания Cu...,Аноним, 12:53 , 25-Авг-08
    - Завершена работа над FreeBSD портом системы распознавания Cu...,Samm, 14:16 , 25-Авг-08
    - Завершена работа над FreeBSD портом системы распознавания Cu...,Samm, 14:19 , 25-Авг-08
хм,raven428, 09:42 , 25-Авг-08
- хм,raven428, 09:43 , 25-Авг-08
- хм,raven428, 09:52 , 25-Авг-08
  - хм,Samm, 14:30 , 25-Авг-08
Завершена работа над FreeBSD портом системы распознавания Cuneiform,hhh, 18:20 , 26-Авг-08

Сообщения в этом обсуждении

"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено Michael Shigorin , 24-Авг-08 01:11

Молодцом :-)

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 24-Авг-08 01:44

стараемся. Щас пытаюсь понять как заставить движок распозновать картинки и таблицы. Код не документирован, да и понимания того как это все работает не хватает, наверное надо будет пойти в гиблиотеку за соотв. литературой. Интересна позиция авторов, они вроде выложили исходники на свой svn, но без доступа к нему, багтрекера и прочих штук, причем исходники еще самые первые, те, которые ничем кроме VC6 не собираются.
Еще интересно было бы получить исходники интерфейса - потому как из примеров совершенно непонятно, например, как получить координаты распознанного символа, что необходимо для написание вменяемой морды.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Александр , 24-Авг-08 16:39

Вот поэтому не очень и хочется копаться в этой жути и отгадывать их загадки. Выдрать бы удачные алгоритмы и похоронить.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 24-Авг-08 18:29

Все (почти все) алгоритмы популярно описаны в соответствующей литературе, причем как минимум 10 летней давности :))

"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено eve , 24-Авг-08 05:00

Слов нет, одни звуки. Молодец!

"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено Jay , 24-Авг-08 12:36

Его бы еще к Kooka прикрутить - это готовый KDE-шный фронтенд для sane и нескольких распознавательных движков.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 24-Авг-08 15:58

Все портируется в виде API, cli утилита - лишь по сути демка его работы, так что было бы желаение. Но, во первых, пока рано (далеко не все работает ещё), во вторых - лично я KDE не использую.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Аноним , 25-Авг-08 12:53

> во вторых - лично я KDE не использую.
Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME и т. д. не остануться в стороне.

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 25-Авг-08 14:16

>> во вторых - лично я KDE не использую.
>
>Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
>и т. д. не остануться в стороне.
Пока на документирование чего либо совершенно нет времени, тем более что куча функци

"Завершена работа над FreeBSD портом системы распознавания Cu..."
Отправлено Samm , 25-Авг-08 14:19

>> во вторых - лично я KDE не использую.
>
>Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
>и т. д. не остануться в стороне.
Пока на документирование чего либо совершенно нет времени, тем более что куча функций не работают или работают некорректно (например, распознование таблиц). В будущем, я думаю что было бы неплохо прикрутить к коду doxygen или другой автогенератор и писать описание функций непосредственно в коде. В данный момент у меня нет сканера, так что если кто-то хочет commandline sane OCR - то donations are welcome :) GUI писать не буду - нет времени и опыта, а вот CLI сканер с libsane - смог бы.

"хм"
Отправлено raven428 , 25-Авг-08 09:42

классно, конечно, но что-то вот эту https://astonshell.com/~raven/pic/test.bmp тестовую картику оно распознать не может:
cuneiform -l eng -o test.txt test.bmp
Cuneiform for Linux 0.3.1
The image depth is 24 at this point.
Warning: RSL said that the lines do not have to withdraw.
или я что-то не так делаю?

"хм"
Отправлено raven428 , 25-Авг-08 09:43

да, и uname -a
FreeBSD sandbox.mks-chel.ru 6.2-STABLE FreeBSD 6.2-STABLE #0: Tue Jan 30 11:36:53 YEKT 2007 root@sonata:/usr/obj/.amd_mnt/golf/usr/nfs/src/sys/sonata i386

"хм"
Отправлено raven428 , 25-Авг-08 09:52

почитал форум проекта, вопрос снят, автор порта тут не причём, это проект такой :-) извините.

"хм"
Отправлено Samm , 25-Авг-08 14:30

>почитал форум проекта, вопрос снят, автор порта тут не причём, это проект
>такой :-) извините.
с warning`ом я уже разобрался и пофиксил, там действительно была проблема порта. А по поволу теста - движок "заточен" и лучше всего работает с файлами 300dpi, если вы сделаете ресайз вашего файла - он будет успешно распознан. Причем внутри движка есть функции для [авто]ресайза картинок, но у меня есть большие сомнения в их корректной работе (причем в принципе, а не в портированной версии). Кроме того resize можно (и нужно, полагаю) делать внутрях libimagemagick, так что если мне будет не лень - я добавлю dpi switch, который будет доступен в imagemagick версии и позволит сканить lowres dpi.
Вообще у меня есть мнение что там большие проблемы c этапом нормализации, но времени на то чтобы как следует в нем разобраться нет + есть ещё много намного более важных проблем.

"Завершена работа над FreeBSD портом системы распознавания Cuneiform"
Отправлено hhh , 26-Авг-08 18:20

Хе-хе. Портировано нашим, закоммичено нашим, да и вообще (последние две новости на FreeBSD.org):
New committer: Max Brazhnikov (ports)
Enhanced commit privileges: Stanislav Sedov (src, ports)
тоже наши. Прям гордость берет :)