У цьому уроці курсу “Програмування для журналістів” продовжимо знайомство з Tesseract і перетворимо у текст багатосторінкові pdf-файли.
Завантаження Poppler: https://bit.ly/3VXDwCv
Посилання на imagepdf_text.py: https://bit.ly/4iVWNyj
Посилання на document.pdf: https://bit.ly/49Q5Exf
Посилання на інструкцію до цього уроку: https://bit.ly/49UNScf
Телеграм-боти Nikcenter для розпізнавання тексту на зображеннях та сканованих pdf-файлах: PDF to TXT: https://bit.ly/414PPR7 IMAGE to TXT: https://bit.ly/49a0SKM