The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Завершена работа над FreeBSD портом системы распознавания Cuneiform

23.08.2008 17:05

Данный проект основан на исходниках, созданных и позднее открытых компанией Cognitive technologies. Порт основан на cuneiform-linux версии 0.3.1 и содержит дополнительные исправления из основного репозитория. Работоспособность порта была проверена на FreeBSD 6 и 7, архитектуры i386 и amd64.

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в HTML формате с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

  1. Главная ссылка к новости (http://www.freshports.org/grap...)
  2. OpenNews: В системе распознавания текста Cuneiform 0.3.1 появилась поддержка FreeBSD
  3. OpenNews: Вышла новая версия Linux редакции системы распознавания печатных текстов Cuneiform
  4. OpenNews: Получение в Cuneiform, запущенном в wine, картинки напрямую со сканера
  5. OpenNews: Опубликован исходный код системы распознавания печатных текстов Cuneiform
  6. OpenNews: Открыты исходные тексты системы оптического распознавания CuneiForm
Автор новости: Alex Samorukov
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/17523-Cuneiform
Ключевые слова: Cuneiform
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (15) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Michael Shigorin (ok), 01:11, 24/08/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Молодцом :-)
     
     
  • 2.2, Samm (??), 01:44, 24/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    стараемся. Щас пытаюсь понять как заставить движок распозновать картинки и таблицы. Код не документирован, да и понимания того как это все работает не хватает, наверное надо будет пойти в гиблиотеку за соотв. литературой. Интересна позиция авторов, они вроде выложили исходники на свой svn, но без доступа к нему, багтрекера и прочих штук, причем исходники еще самые первые, те, которые ничем кроме VC6 не собираются.

    Еще интересно было бы получить исходники интерфейса - потому как из примеров совершенно непонятно, например, как получить координаты распознанного символа, что необходимо для написание вменяемой морды.

     
     
  • 3.6, Александр (??), 16:39, 24/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Вот поэтому не очень и хочется копаться в этой жути и отгадывать их загадки. Выдрать бы удачные алгоритмы и похоронить.
     
     
  • 4.7, Samm (??), 18:29, 24/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Все (почти все) алгоритмы популярно описаны в соответствующей литературе, причем как минимум 10 летней давности :))
     

  • 1.3, eve (?), 05:00, 24/08/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Слов нет, одни звуки. Молодец!
     
  • 1.4, Jay (??), 12:36, 24/08/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Его бы еще к Kooka прикрутить - это готовый KDE-шный фронтенд для sane и нескольких распознавательных движков.
     
     
  • 2.5, Samm (??), 15:58, 24/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Все портируется в виде API, cli утилита - лишь по сути демка его работы, так что было бы желаение. Но, во первых, пока рано (далеко не все работает ещё), во вторых - лично я KDE не использую.
     
     
  • 3.11, Аноним (11), 12:53, 25/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > во вторых - лично я KDE не использую.

    Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME и т. д. не остануться в стороне.

     
     
  • 4.12, Samm (??), 14:16, 25/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >> во вторых - лично я KDE не использую.
    >
    >Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
    >и т. д. не остануться в стороне.

    Пока на документирование чего либо совершенно нет времени, тем более что куча функци


     
  • 4.13, Samm (??), 14:19, 25/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >> во вторых - лично я KDE не использую.
    >
    >Главное, документируй то в чём разобрался, тогда те кто любят KDE, GNOME
    >и т. д. не остануться в стороне.

    Пока на документирование чего либо совершенно нет времени, тем более что куча функций не работают или работают некорректно (например, распознование таблиц). В будущем, я думаю что было бы неплохо прикрутить к коду doxygen или другой автогенератор и писать описание функций непосредственно в коде. В данный  момент у меня нет сканера, так что если кто-то хочет commandline sane OCR - то donations are welcome :) GUI писать не буду - нет времени и опыта, а вот CLI сканер с libsane - смог бы.


     

  • 1.8, raven428 (ok), 09:42, 25/08/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    классно, конечно, но что-то вот эту https://astonshell.com/~raven/pic/test.bmp тестовую картику оно распознать не может:

    cuneiform  -l eng -o test.txt test.bmp
    Cuneiform for Linux 0.3.1
    The image depth is 24 at this point.
    Warning: RSL said that the lines do not have to withdraw.

    или я что-то не так делаю?

     
     
  • 2.9, raven428 (ok), 09:43, 25/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    да, и uname -a
    FreeBSD sandbox.mks-chel.ru 6.2-STABLE FreeBSD 6.2-STABLE #0: Tue Jan 30 11:36:53 YEKT 2007     root@sonata:/usr/obj/.amd_mnt/golf/usr/nfs/src/sys/sonata  i386
     
  • 2.10, raven428 (ok), 09:52, 25/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    почитал форум проекта, вопрос снят, автор порта тут не причём, это проект такой :-) извините.
     
     
  • 3.14, Samm (??), 14:30, 25/08/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >почитал форум проекта, вопрос снят, автор порта тут не причём, это проект
    >такой :-) извините.

    с warning'ом я уже разобрался и пофиксил, там действительно была проблема порта. А по поволу теста - движок "заточен" и лучше всего работает с файлами 300dpi, если вы сделаете ресайз вашего файла - он будет успешно распознан. Причем внутри движка есть функции для [авто]ресайза картинок, но у меня есть большие сомнения в их корректной работе (причем в принципе, а не в портированной версии). Кроме того resize можно (и нужно, полагаю) делать внутрях libimagemagick, так что если мне будет не лень - я добавлю dpi switch, который будет доступен в imagemagick версии и позволит сканить lowres dpi.

    Вообще у меня есть мнение что там большие проблемы c этапом нормализации, но времени на то чтобы как следует в нем разобраться нет + есть ещё много намного более важных проблем.

     

  • 1.15, hhh (?), 18:20, 26/08/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Хе-хе. Портировано нашим, закоммичено нашим, да и вообще (последние две новости на FreeBSD.org):

    New committer: Max Brazhnikov (ports)
    Enhanced commit privileges: Stanislav Sedov (src, ports)

    тоже наши. Прям гордость берет :)

     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру