URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 38324
[ Назад ]

Исходное сообщение
"Тематический каталог: Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"

Отправлено auto_topic , 04-Сен-07 16:36 
Обсуждение статьи тематического каталога: Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)

Ссылка на текст статьи: http://www.opennet.me/base/rus/osr_tesseract_rus.txt.html


Содержание

Сообщения в этом обсуждении
"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено glyph , 04-Сен-07 16:36 
Достойно уважения. Так держать!

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено vadiml , 04-Сен-07 17:00 
Так получается можно хорошенько потренировать программу, а потом выложить результат в инет и будет более-менее нормальная распознавалка для линукса

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang tran..."
Отправлено HarryPotter , 04-Сен-07 17:49 
Совершенно верно!

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено vehn , 05-Сен-07 00:30 
Отличная статья

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено Ник , 06-Сен-07 19:46 
Спасибо! Но лучше всего, ИМХО, обучать всем вместе и выложить результат на оф.сайт...

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang tran..."
Отправлено HarryPotter , 06-Сен-07 20:36 
Для этого уже и создана группа на Гугле
http://groups.google.com/group/tesseract-ocr-russian/

Милости просим всех желающих!


"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено Дмитрий , 15-Сен-07 22:35 
В статье есть ошибка: лицензия, под которой распространяется код tesseract - это лицензия Apache версии 2.0, а не GPL.

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang tran..."
Отправлено HarryPotter , 16-Сен-07 10:30 
Согласен, исправил.

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено Robot , 21-Сен-07 20:10 
А что группа сдохла???

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено Дима , 03-Фев-11 21:58 
Огромное спасибо Мужик! Затрахался читать английскую версию

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang translate)"
Отправлено watson , 26-Окт-11 17:16 
в версии 3.01 собирается из всех файлов один , к примеру rus.trainddata , есть ли возможность дообучить существующий язык? Тоесть получить filename.tr из этого файла и уже добавить к нему свой ,тем самым расширить словарь или добавить новые шрифты.

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang tran..."
Отправлено Денис , 07-Ноя-13 19:04 
Тоже интересен этот вопрос. Нашли решение?

"Как научить OCR Tesseraсt русскому языку. (ocr rus lang tran..."
Отправлено kik11 , 01-Авг-14 14:36 
Как вариант - не удалять .box, и при появлении новых образцов вместе с ними обновлять .traineddata