O módulo pyPdf é capaz de manipular e de obter dados de documentos pdf.
No exemplo abaixo, faremos a manipulação mais básica que é a obteção do total de páginas de um documento pdf. Mas é possível efetuar uma série de operações de manipulação assim como de obtenção de dados deste tipo de documento.
#Importa o módulo de manipulaçao de arquivos PDF
import pyPdf
#Define o caminho para o arquivo a ser analisado
target_file_path = <caminho_para_o_arquivo>
#Cria o objeto de representação do documento PDF
Pdf = pyPdf.PdfFileReader(file(target_file_path, “rb”))
#Obtem o total de páginas do documento PDF
print Pdf.getNumPages()