Skip to main content

Урок 21. Розпізнавання багатосторінкових PDF. Лінукс рятівник

У цьому уроці курсу “Програмування для журналістів” продовжимо знайомство з Tesseract і перетворимо у текст багатосторінкові pdf-файли.

Завантаження Poppler: https://bit.ly/3VXDwCv

Посилання на imagepdf_text.py: https://bit.ly/4iVWNyj

Посилання на document.pdf: https://bit.ly/49Q5Exf

Посилання на інструкцію до цього уроку: https://bit.ly/49UNScf

Телеграм-боти Nikcenter для розпізнавання тексту на зображеннях та сканованих pdf-файлах: PDF to TXT: https://bit.ly/414PPR7 IMAGE to TXT: https://bit.ly/49a0SKM