[Acr DC] PDF Текст и картинки-иконки в тексте перевести в .docx

  • Автор темы Автор темы tofan
  • Дата начала Дата начала

tofan

Топикстартер
15 лет на форуме
Сообщения
258
Реакции
37
Кто может посоветовать, как этот винегрет текста и картинок лучше и быстрее всего распознать? чтобы и текст остался нормальным (предложением), а не кучей текстовых рамочек, и картинки чтобы в тексте были.
 

Вложения

  • Рисунок1.png
    Рисунок1.png
    173.8 КБ · Просм.: 262
А какой оригинал? Если растр , замазать картинки белым, распознать, а потом вставить
 
  • Спасибо
Реакции: tofan
оригинал - хороший PDF, но картинок много, каждую замазывать. придется таки в два захода распознавать, сначала текст, ничего не замазывая, на месте картинок получатся, конечно, всякие кракозябры, потом обвести каждую картинку, и опять распознать, и вставлять по одной в текст, в общем, кошмар намечается
 
Кто может посоветовать, как этот винегрет текста и картинок лучше и быстрее всего распознать? чтобы и текст остался нормальным (предложением), а не кучей текстовых рамочек, и картинки чтобы в тексте были.
Это скорее всего переводческое агентство... Дают PDF с одним языком (в данном случае русский), куча картинок-иконок по тексту + текст другого языка (например английский). Нужно заменить русский текст на английский.

Я бы из pdf вытащил картинки и все заново сверстал, а не мучался с заменой в pdf текста
 
  • Спасибо
Реакции: tofan

Не по теме:
Вот характерный пример того, когда кроилово одних приводит к попадалову других ;)
 
  • Спасибо
Реакции: tofan
и вставлять по одной в текст, в общем, кошмар намечается
Действительно проще и быстрее заново сверстать. Например, в индизайне: разных иконок там не так много, один раз иконку вставить, настроить anchored object и копипастить потом по месту.
 
  • Спасибо
Реакции: tofan
вы почти угадали с переводом, мне нужно подготовить этот документ для последующего перевода, pdf переделываю в ворд, нужен текст и картинки в нем, потом он идет на перевод
 
вы почти угадали с переводом, мне нужно подготовить этот документ для последующего перевода, pdf переделываю в ворд, нужен текст и картинки в нем, потом он идет на перевод
Мне показалось, что оплата за эту работу, не покроет мои затраты на электроэнергию
 
  • Спасибо
Реакции: tofan
А в каком виде PDF - растр или вектор?
 
  • Спасибо
Реакции: tofan
В таком случае, не пойму, зачем тут вообще OCR?
 
  • Спасибо
Реакции: tofan
текст должен быть в ворде. из pdf его, конечно, можно вытащить, просто вот так копируя, но картинки при этом не копируются, приходится тащить их в OCR, ну а как иначе?
 

Вложения

  • Рисунок2.png
    Рисунок2.png
    202.6 КБ · Просм.: 239
А что если из самого акробата сохранить как вордовский документ? Разве не получается?
 
  • Спасибо
Реакции: tofan
Образец странички PDF надо прикладывать, либо шабаш ведьм и колдунов предсказывать отказывается.
 
  • Спасибо
Реакции: tofan
На тот случай, если по каким то религиозным соображением вам некошерно пользоваться акробатовским конвертером
 
  • Спасибо
Реакции: tofan
  • Спасибо
Реакции: tofan
прикрепила две странички pdf. Если делать экспорт из актобата в ворд, такой бардак получается, текст бьется на куски в текстовых рамках, сами картинки не берутся, потому что они под текстом, не, лучше уж в OCR, а открывать pdf прямо из ворда и не пробовала даже, надо попробовать, но что-то мне так кажется, что будет аналогичный бардак, когда на экспорт из акробата. пока некогда экспериментировать, надо доделать
 

Вложения

Можно разделить префлайтом картинки и текст в разные слои документа (по желанию можно разделить на 2 pdf, в одном картинки на своих местах, в другом текст также префлайтами). Без переверстки думаю сделать не получится. Но замазывать уж точно ничего не нужно :)
 
  • Спасибо
Реакции: tofan
  • Спасибо
Реакции: tofan