The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Релиз системы распознавания текста Tesseract 5.3.4, opennews (??), 18-Янв-24, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


30. "Релиз системы распознавания текста Tesseract 5.3.4"  +1 +/
Сообщение от cat666 (ok), 19-Янв-24, 21:22 
Ты даже не в теме. Никакие куски питона там не нужны. Я собирал на C++ и библиотеку и программу распознавания. Всё остальное просто нервно курит в сторонке по качеству распознавания. Много документации на английском, для этого надо просто зайти на GitHub. Китайцы молодцы.
Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

33. "Релиз системы распознавания текста Tesseract 5.3.4"  +1 +/
Сообщение от Аноним (33), 20-Янв-24, 15:25 
Китайцы безусловно молодцы, факт.

> Всё остальное просто нервно курит в сторонке по качеству распознавания.

Само-собой, нейронки нещадно нагибают классический подход.

> Я собирал на C++ и библиотеку и программу распознавания.

cpp_infer? Оно работало, но это скорее побочное демо. Основная софтина — это именно питона кусок.

> Много документации на английском

Какая–то есть. Актуальность и полноту по сравнению с китайской берёшься гарантировать? (спойлер: китайская полнее и актуальнее) Поиск по багтрекеру тоже возьмёшся организовать?

Штука не в том. PaddleOCR развивается, тестируется и поддерживается именно как датасатанистский проект с питоном во все поля. Не как сишная либа. Отдельные инициативы по запуску моделей на нативных рантаймах — это именно что демки и proof–of–concept. Без поддержки и гарантий актуализации. Самое ценное там — это компактные модели, но обвязку под них придётся допиливать самостоятельно.

В том и разница: Tesseract компактен, самодостаточен и почти без сторонних зависимостей (всё чтение форматов и обработка картинок вынесены в leptonica). А PaddleOCR — это нейронка, приклеенная к нагромождению third–party либ (один OpenCV чего стоит), и всё насквозь перемотанное синей изолентой. С огромным количеством «если», «может быть» и «— Е..нёт? — Не должно».

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру