Author Topic: Редактирование распознанных pdf  (Read 1502 times)

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 29331
  • Карма: +4054/-334
    • View Profile
  • 0
  • 0
Нашёл замечательную программу PDFX-Editor, которая позволяет исправлять текст в pdf! Я с настоящим остервенением стал исправлять свои языковые учебники с опечатками, которые меня давно раздражали. Особо много у меня злости по отношению к классическому самоучителю итальянского Добровольской, переизданному в 2005. Мразотина (нет лучше слов), которая издавала учебник, похоже просто пропустила сканы через FineReader - "и так сойдёт" - в результате в книге навалом "г" вместо "r" или "д" вместо "g", не говоря уже про "i" вместо "l" и т.д.

Но я столкнулся с другой проблемой: есть пдф, где распознанный текст и сам текст - одно и тоже, они исправляются прекрасно, но есть такие, где распознанный текст - отдельным слоем, который участвует только в поиске, а само изображение - вроде картинки. В пдфках второго типа исправления остаются только в распознанном слое, а сам пдф так и остаётся с ошибками. Есть какой-то способ заменить "картинку" распознанным текстом? :-\

Offline Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4973
  • Карма: +440/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Редактирование распознанных pdf
« Reply #1 on: 24 May 2021, 12:26:20 »
  • 0
  • 0
Есть какой-то способ заменить "картинку" распознанным текстом?
А если просто удалить картинку, то под ней текста не будет?
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4973
  • Карма: +440/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Редактирование распознанных pdf
« Reply #2 on: 24 May 2021, 12:55:42 »
  • 0
  • 0
Если не получится, то можно прислать какой-то примерчик? Видел такие pdf-ки, но сейчас под рукой нет...
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Euskaldun

  • Администратор
  • Трижды герой
  • *****
  • Posts: 29331
  • Карма: +4054/-334
    • View Profile
Re: Редактирование распознанных pdf
« Reply #3 on: 24 May 2021, 15:22:35 »
  • 0
  • 0
Есть какой-то способ заменить "картинку" распознанным текстом?
А если просто удалить картинку, то под ней текста не будет?
там не "картинка", я просто назвал так - там векторное изображение сканированного текста. Можно ли удалить это? Скорее всего да, но это не решит проблему, так как эта картинка и ОСR находятся в разных слоях, и такой пдф просто будет выглядеть пустым при просмотре. Распознанный ОСR находится в каком-то служебном слое, который обычные просматривали не показывают, он только доступен для функции поиска.

Offline Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4973
  • Карма: +440/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Редактирование распознанных pdf
« Reply #4 on: 24 May 2021, 17:19:35 »
  • 0
  • 0
там не "картинка", я просто назвал так - там векторное изображение сканированного текста.
Хмм, а такого вот даже и не видел. Интересно посмотреть.
Распознанный ОСR находится в каком-то служебном слое, который обычные просматривали не показывают, он только доступен для функции поиска.
Думаю, возможно будет перенести этот текст на обычный видимый слой.
« Last Edit: 24 May 2021, 17:21:06 by Upliner »
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Upliner

  • Администратор
  • Герой
  • *****
  • Posts: 4973
  • Карма: +440/-18
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Редактирование распознанных pdf
« Reply #5 on: 24 May 2021, 18:08:55 »
  • 0
  • 0
PDFX-Editor, которая позволяет исправлять текст в pdf!
Кстати, конкретно этот редактор в гугле не могу найти. Хотя в принципе можно с торрентов скачать крякнутый Acrobat Pro, там должны быть все нужные функции.
Дві найголовніші помилки українського народу -- зек і зєк.