Страница 1 из 1

Из PDF в текст

Добавлено: 19 мар 2012, 22:38
Duke_Nukem
Имеется отсканированная книга в формате PDF (хорошее качество, буквы видно четко). Есть ли какая-нибудь софтина чтоб перевести это в текстовый формат?

Re: Из PDF в текст

Добавлено: 19 мар 2012, 23:34
alsolnze
ABBYY FineReader 9.0

Re: Из PDF в текст

Добавлено: 19 мар 2012, 23:39
Duke_Nukem
alsolnze писал(а):ABBYY FineReader 9.0
Спасибо, работает :Yahoo!: Только я пробник скачал 11.0

Re: Из PDF в текст

Добавлено: 20 мар 2012, 00:25
alsolnze
Duke_Nukem писал(а):
alsolnze писал(а):ABBYY FineReader 9.0
Спасибо, работает :Yahoo!: Только я пробник скачал 11.0
могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...

Re: Из PDF в текст

Добавлено: 20 мар 2012, 00:34
Duke_Nukem
alsolnze писал(а):
Duke_Nukem писал(а):
alsolnze писал(а):ABBYY FineReader 9.0
Спасибо, работает :Yahoo!: Только я пробник скачал 11.0
могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...
Да, и еще нельзя заменять ошибки. Буду искать полную

Re: Из PDF в текст

Добавлено: 20 мар 2012, 01:27
GSX
В на трекере нету разве?
Portable:
CЕ Litе portable;

FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack

Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС

Re: Из PDF в текст

Добавлено: 20 мар 2012, 01:33
Duke_Nukem
GSX писал(а):В на трекере нету разве?
Portable:
CЕ Litе portable;

FinеRеadеr CE 11.0.102.583 portable
Интерфейс русский, языки распознавания - русский, английский, греческий, цифры. Другие языки/интерфейсы/хелпы и пр. подключаются плагинами AppLinks. Версия ThinApp 4.7.
Соединение со сканером работать, скорее всего, не будет. Остальное проверяйте самостоятельно.
=====
FinеRеadеr 11.0.102.583 CЕ FULL Rеpack

Особенности
Платформа: x86/x64
Язык: Русский, Английский, Украинский
Присутствуют все языки распознавания
Лекарство вшито (от Pafnutiy761)
Сервис лицензирования удален
==
все ссылки отправлены в ЛС
:beer:

Re: Из PDF в текст

Добавлено: 20 мар 2012, 10:56
serbio
ABBYY PDF Transformer офигительно все конвертит в эксел ворд и т.д.

Re: Из PDF в текст

Добавлено: 20 мар 2012, 14:25
Filimon Кykyev
serbio писал(а):ABBYY PDF Transformer офигительно все конвертит в эксел ворд и т.д.
Если пдф был из текста создан.
А если, как картинка или скан не пройдет.
alsolnze писал(а):могу ошибаться, но вроде бы в пробной версии нельзя перевести сразу все страницы, а только по одной... Т.е. распознать можно все, а вот передать все страницы в единый документ не получится...
Там по памяти могут ограничения быть, книга больше ресурса сожрет.

ABBYY FineReader - самое то. Только (могу ошибиться) в pdf-файле может быть защита от распознавания.
У меня была ситуевина, пришлось распечатать, отсканировать, править в фоторедакторе (свет-контраст) и потом уже распознавать :crazy:

Re: Из PDF в текст

Добавлено: 20 мар 2012, 17:13
GSX
Filimon Кykyev, а ломануть ни как? :
Wondershare PDF Password Remover
PDF Password Remover
SysTools PDF Unlocker

ABBYY PDF Transformer 3 http://nnm-club.ru/forum/viewtopic.php?t=353174

PDF to Word Online - http://www.pdfonline.com/pdf-to-word-converter/ (не пробовал)

Re: Из PDF в текст

Добавлено: 20 мар 2012, 17:18
Швейк
GSX писал(а):а ломануть ни?как?
В дубненском ОБЭПе работают очень добрые, хорошие и вежливые люди, которые запросто "рубят показатели" на таких неграмотных школьниках, как Вы.
Приходите к Филимону в гости, ломаните прогу, светаните личико в Веб-камеру.
Всего-то до двух лет лишения свободы. :smile:

Изображение

Re: Из PDF в текст

Добавлено: 20 мар 2012, 17:29
flint
Швейк писал(а): В дубненском ОБЭПе...
уэбипк

Re: Из PDF в текст

Добавлено: 20 мар 2012, 17:32
GSX
del

Re: Из PDF в текст

Добавлено: 20 мар 2012, 17:43
Швейк
GSX писал(а):- не из Дубны я.
Был бы человек хороший, а статья всегда найдётся и каталажек на всех хватит. :smile:
Явку с повинной - всегда примем.
http://www.gutallin.ru/news.html

Изображение

Re: Из PDF в текст

Добавлено: 20 мар 2012, 18:44
Filimon Кykyev
GSX писал(а):Filimon Кykyev, а ломануть ни как?
Иногда прошел ломки занимает больше времени, чем более простой путь :smile:

Re: Из PDF в текст

Добавлено: 21 мар 2012, 03:39
LuckyOne
Duke_Nukem писал(а):Имеется отсканированная книга в формате PDF (хорошее качество, буквы видно четко). Есть ли какая-нибудь софтина чтоб перевести это в текстовый формат?
Конечно есть! И совершенно бесплатно. Инструкция в два шага:

1. ставим Линукс.
2. открываем консоль, и набираем там две простых команды подряд:
$> convert -density 200 my_file.pdf my_file.png
$> gocr -i my_file-*.png > my_file.txt

Всё, в файле my_file.txt содержится прекрасно распознанный текст. Если GOCR по какой-то непонятной причине не нравится, то есть гуглевский Tesseract, тоже бесплатный.

Re: Из PDF в текст

Добавлено: 21 мар 2012, 12:53
GSX
Што бы Линукс поставить нужно жесткий правильно на разделы разбить. С LiveCD можно все сделать, без установки системы, как вариант :smile:

Re: Из PDF в текст

Добавлено: 21 мар 2012, 13:54
Filimon Кykyev
GSX писал(а):Што бы Линукс поставить нужно жесткий правильно на разделы разбить.
В 7-х окнах, есть штатная виртуальная машина, запускай и ставь какую хочешь систему, хоть андроид. Поработал, потом снес, всего делов-то :smile: