URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID9
Нить номер: 5760
[ Назад ]

Исходное сообщение
"pdf - вытащить текст"

Отправлено darkmen , 30-Сен-06 17:30 
Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext и все вроде как хорошо, пока не нашел смещение. Вот мой вопрос как своими средствами вытащить данные желательно на с или перл, если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может повезет и найду почему он смещает нужные мне строки.

Содержание

Сообщения в этом обсуждении
"pdf - вытащить текст"
Отправлено darkmen , 02-Окт-06 20:18 
>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>и все вроде как хорошо, пока не нашел смещение. Вот мой
>вопрос как своими средствами вытащить данные желательно на с или перл,
>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>повезет и найду почему он смещает нужные мне строки.


САМ РАЗОБРАЛСЯ>>>как обычно


"pdf - вытащить текст"
Отправлено horsh , 02-Окт-06 21:58 
>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>повезет и найду почему он смещает нужные мне строки.
>
>
>САМ РАЗОБРАЛСЯ>>>как обычно

И каков правильный ответ?



"pdf - вытащить текст"
Отправлено darkstar , 03-Окт-06 09:42 
>>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>>повезет и найду почему он смещает нужные мне строки.
>>
>>
>>САМ РАЗОБРАЛСЯ>>>как обычно
>
>И каков правильный ответ?


Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но еще не совсем но лучше чем было


"pdf - вытащить текст"
Отправлено vampersha , 20-Окт-06 13:31 
>>>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>>>повезет и найду почему он смещает нужные мне строки.
>>>
>>>
>>>САМ РАЗОБРАЛСЯ>>>как обычно
>>
>>И каков правильный ответ?
>
>
>Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но
>еще не совсем но лучше чем было

попробуй PDF transformer - вторая версия вроде много чего аккуратно делает. Триальник лежит на http://www.pdftransformer.com/


"pdf - вытащить текст"
Отправлено NoName , 28-Мрт-07 00:01 
>>>>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>>>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>>>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>>>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>>>>повезет и найду почему он смещает нужные мне строки.
>>>>
>>>>
>>>>САМ РАЗОБРАЛСЯ>>>как обычно
>>>
>>>И каков правильный ответ?
>>
>>
>>Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но
>>еще не совсем но лучше чем было
>
>попробуй PDF transformer - вторая версия вроде много чего аккуратно делает. Триальник
>лежит на http://www.pdftransformer.com/


Другие варианты не встречались, нужно для Linux


"pdf - вытащить текст"
Отправлено Антон , 15-Окт-07 12:44 
>[оверквотинг удален]
>>>
>>>
>>>Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но
>>>еще не совсем но лучше чем было
>>
>>попробуй PDF transformer - вторая версия вроде много чего аккуратно делает. Триальник
>>лежит на http://www.pdftransformer.com/
>
>
>Другие варианты не встречались, нужно для Linux

Программа Text Mining Tool может помочь, мне кажется - http://ru.text-mining-tool.com