Como ler um PDF / livro em Python com pouquíssimas linhas de código

image_pdfimage_print

Python é muito poderoso, todos sabemos. Compartilho abaixo um código capaz de manipular o básico de um PDF e ler partes de páginas PDF de maneira fácil, simples e muito intuitiva.

#Manipular arquivos PDF
import PyPDF2
#Efetuar o Text To Speak
import pyttsx3

book = open('<NOME_DO_LIVRO>.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(book)
pages = pdfReader.numPages

speaker = pyttsx3.init()
#Quais páginas ler. Atenção a Capa e Contra-capas, índices, etc. No caso, apenas a capa foi saltada.
for num in range(1, pages):
    page = pdfReader.getPage(num)
    text = page.extractText()
    speaker.say(text)
    speaker.runAndWait()

Gostou? Tire um minutinho e dê sua contribuição para Drall Dev Community no Patreon!