Транслит при извлечении текста

  • Автор темы Автор темы dmifed
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

dmifed

Участник
Топикстартер
Сообщения
222
Реакции
56
Здравствуйте.
Проблема в следующем:
Есть пдф-файл, из него нужно вытащить текст. Пробовал сохранять как doc, rtf, txt, выделять текст в акробате, копировать и вставлять в ворд, блокнот и тд, делал edit page, также залинковал его в InDesign, и напечатал в пдф заново. Везде одна и та же проблема текст вытаскивается транслитом, например, слова "Отслаивающийся и слабый" становятся "Otslaiwa@]ijsq i slabyj". Пробовал питстопом менять шрифт - появляются квадраты.
Win XP Acrobat 7.09 Pitstop 6.5, InDesign 5.0 Illustrator 13.0
В акробате в свойствах документа Application InDesign 5.0.2; PDF Producer Distiller 4.0 for Mac; version 1.3
Что еще можно попробовать, не считай файнридер? Если тема уже обсуждалась, дайте, пожалуйста, ссылку - самостоятельно найти не получилось. Заранее спасибо!
 
Ответ: Транслит при извлечении текста

дайте страничку глянуть
 
Ответ: Транслит при извлечении текста

Вот страница из документа
 

Вложения

Ответ: Транслит при извлечении текста

Прикольно =)
Имхо, я б не парился. Файнридер.
Есть програмка - Штирлиц называется. Так вот. Вставив текст туда и сделав вот такое преобразование KOI-7 -> WIN получил файлик см. аттач
 

Вложения

  • txt.txt
    txt.txt
    2.4 КБ · Просм.: 650
Ответ: Транслит при извлечении текста

Действительно, прикольно. ))

Но таки все-равно не вижу необходимости в Штирлице.
В аттаче — результат PDF Transformera 1.0
Всего-то нужно нажать на файле правую кнопку мыши и выбрать в меню "Сохранить как DOC/RTF".

Update
Хотя в моем варианте нужен PDF Transformer, да. :)
 

Вложения

Ответ: Транслит при извлечении текста

Evgen сказал(а):
Хотя в моем варианте нужен PDF Transformer, да. :)
Каждый извращается по-своему =) =)
Но так, согласен лучше, ибо меньше движений.
 
Ответ: Транслит при извлечении текста

Evgen сказал(а):
Действительно, прикольно. ))
Возможности PS, PDF неисчерпаемы.
Если для PS, есть соглашения о написании PS программы, то для PDF их нет (PDF-X отдыхает, в этом случае). Это все не противоречит спецификациям PDF. PDF Transformer учитывает наши желания. Первый раз вижу, чтобы ID писал такой PDF, это не спец-шутка?
 
Ответ: Транслит при извлечении текста

Всем большое спасибо! С помощью pdf transformera все получилось.
PS. Однако, интересно почему получался транслит...
2 igors Это не шутка. Файлы скачаны с сайта производителя
 
Ответ: Транслит при извлечении текста

mr.Death сказал(а):
PS. Однако, интересно почему получался транслит...
2 igors Это не шутка. Файлы скачаны с сайта производителя
Просто раньше (в последнее время) таких font's мне не попадались, на месте английских char русские буквы в сооттветствии с транслит...
 
Ответ: Транслит при извлечении текста

Это шрифт такой, видимо для иностранцев так проще набирать кириллицей.
 

Вложения

Ответ: Транслит при извлечении текста

> Просто раньше (в последнее время) таких font's мне не попадались, на месте английских char русские буквы в сооттветствии с транслит...

Такие шрифты были очень давно (примерно 1990 г.) на макинтошах. А ещё был такой редактор научных текстов — Чирайтер, там тоже было так.
 
Ответ: Транслит при извлечении текста

Спасибо. Не знал, что бывают такие шрифты.
 
Статус
Закрыто для дальнейших ответов.