Помогите новичку. Не могу скопировать текст из PDF

  • Автор темы Автор темы akobelkov
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Добрый день!

До этого пользовался только Acrobat Reader, никогда тексты не верстал.

Проблема.
Есть pdf файл с описанием продукции. На одной странице текст (русский язык) описания можно копировать, на остальных нет. Скачал Adobe Acrobat 7.0 Prof думал что он разберет страницу на элементы и позволит скопировать текст, но в нем тоже нельзя скопировать. Защиты на документе нет (посмотрел в акробате). Пробовал конверторы из PDF в Word, один тупо страницы преобразовал в картинки, второй тоже ничего хорошего не сделал.

Вопрос. Как скопировать текст? Ведь не картинками же его делали :-)
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Оптимальный вариант - распознать через FineReader или ему подобные.
А вообще, файл неплохо было бы посмотреть.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Во-первых, убедитесь, что ваш файл содержит шрифты, а не кривые и не растр: Ctrl+D\Fonts.

Если текст в шрифтах:
В Acrobat'e есть инструмент Select Text: выделяете\Copy\Paste.
Если нужно извлечь весь текст, тогда экспорт в RTF.

Если нет:
В меню Document есть команда OCR Text... (правда не уверен, что 7.0 распознает кириллицу).
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Во-первых, убедитесь, что ваш файл содержит шрифты, а не кривые и не растр: Ctrl+D\Fonts.

Если текст в шрифтах:
В Acrobat'e есть инструмент Select Text: выделяете\Copy\Paste.
Если нужно извлечь весь текст, тогда экспорт в RTF.

Если нет:
В меню Document есть команда OCR Text... (правда не уверен, что 7.0 распознает кириллицу).

Да, практически все это делал. Повторюсь, на одной странице можно использовать Select Text, на остальных нет.
Как в OCR подключить русский язык?

Файл не могу вложить в сообщение, большой. Сейчас разберусь с местным файлообменником.
 

Вложения

  • Swati_1.png
    Swati_1.png
    6.9 КБ · Просм.: 1 876
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Оптимальный вариант - распознать через FineReader или ему подобные.
А вообще, файл неплохо было бы посмотреть.

Залил файл (ссылку не разрешает добавить на него, называется Каталог.Страница 6)

Скажите, а картинки всегда надо собирать? :-)


Этот диалог я видел, но там у меня нет русского языка :-( Видимо надо дополнение какое-то ставить.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Вот ссылка на файл - http://forum.rudtp.ru/downloads.php?do=file&id=407

На этой странице текст в кривых.


Подскажите пжл как мне следует поступить чтобы появилась возможность его скопировать? Исходники уже запросил у автора, но ждать не хочется.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

1. Распознать средствами Акробата Про и сохранить как rtf - с него уже вытянуть текст.
2. Распознать средствами Акробата Про открыть, в Serif PagePlus - в самом pdf сделать коррекцию по быстрому.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

В 7-м Акробате русского OCR вроде не было.

Вот, распознал Finereader, сначала пришлось в Illustrator убрать лишнее и увеличить. Сверху и сбоку пару слов наберете самостоятельно.

Посмотреть вложение SWATI_catalogue 6_.rar.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

В 7-м Акробате русского OCR вроде не было.

Вот, распознал Finereader, сначала пришлось в Illustrator убрать лишнее и увеличить. Сверху и сбоку пару слов наберете самостоятельно.

Посмотреть вложение 50723.

Блин, не думал что так сложно будет :-) Придется FineReader ставить. На всяк. случай каким распознавали, версия?
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

В 7-м Акробате русского OCR вроде не было.
Это да. Только с 9-го появился. Первый пост невнимательно прочитал.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Версия Finereader 10, pdf делал такой:
http://forum.rudtp.ru/downloads.php?do=file&id=408

Acrobat 10 мой pdf тоже нормально распознает. А 7-й Acrobat просто отказался распознавать, даже если бы в нем был русский словарь, толку было бы мало.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Версия Finereader 10, pdf делал такой:
http://forum.rudtp.ru/downloads.php?do=file&id=408

Acrobat 10 мой pdf тоже нормально распознает. А 7-й Acrobat просто отказался распознавать, даже если бы в нем был русский словарь, толку было бы мало.

Красивый файл, ка к вы картинки убрали?
Запутался немного. У меня два pdf-каталога.
Как их преобразовать для распознования FR? Попробовал ABBYY FineReader 6.0 Sprint но он не хочет pdf кушать.
Подскажите правильную последовательность дествий, пжл.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Вообще достаточно просто увеличить раз в 4-5.

ABBYY FineReader 6.0 Sprint но он не хочет pdf кушать
Он не умеет, научился по-моему с 8-й версии, и не Sprint.

Можно сохранить из Акробата в jpeg/tiff с высоким разрешением и распознавать вашим Sprint. Должно получится.

Красивый файл, ка к вы картинки убрали?
Я написал:
сначала пришлось в Illustrator убрать лишнее и увеличить
Но это лишняя и не очень нужная работа, у вас вроде много страниц.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Появилась потребность переделать слегка буклет, т.е. заменить название в нижнем колонтитуле на свое ну и первые страницы переписать. В каком ПО это лучше сделать? И еще зачем делают текст в виде картинок, чтобы нельзя было скопировать?
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Буклет в pdf? Сколько страниц? Нк видя конкретного макета, довольно сложно сказать.
Если наугад: Serif, InDesign, Illustrator - выбирайте что больше нравится.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Буклет в pdf? Сколько страниц? Нк видя конкретного макета, довольно сложно сказать.
Если наугад: Serif, InDesign, Illustrator - выбирайте что больше нравится.
Ну это я его так назвал, может неправильно. Мне нужна возможность редактировать PDF файл, убирать картинки из него и всталвять свои. Добавить свой текст. Попробую Illustrator. Пример старницы все еще лежит в файлообменнике - Каталог.Страница 6
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Ваш исходный файл был создан в INDD, но в нем вы редактировать PDF не сможете. Если и вы владеете Ai, то лучше в нем постранично и работать.
 
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Ваш исходный файл был создан в INDD, но в нем вы редактировать PDF не сможете. Если и вы владеете Ai, то лучше в нем постранично и работать.
Я Ai первый раз в глаза вижу и как уже писал только Adobe Reader использовал, тема дизайна и верстки оочень далека от меня, но как говориться нужда заставила :-) Подредактировал слегка страницы в Ai, НО появился вопрос. Совсем не понимаю под какой формат сделан каталог. Я попробовал распечатать, совсем маленький получается размер на А4. Подскажите возможно ли из этого размера Ai показывает W 255,118 pt H 340,157 pt сделать по-больше без потери качества и каким средством?

Спасибо за терпение к моим вопросам!!!
 
Статус
Закрыто для дальнейших ответов.