Хорошо, я пытаюсь извлечь текст из файла PDF и отобразить облако слов из извлеченного текста.
Получение TypeError: объект 'module' не вызывается
по линии
cloud = wordcloud(mask=rsMask).generate(pageObj.extractText())
Вот код, который я запускаю, спасибо заранее, ура:
#Extracting text from a pdf
import wordcloud
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
import PyPDF4
pdfFileObj = open('Test-Resume-Doc.pdf', 'rb')
pdfReader = PyPDF4.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(0)
pageText = (pageObj.extractText())
pdfFileObj.close()
rsMask = np.array(Image.open('Resume_WordCloud.png'))
print(rsMask)
#
cloud = wordcloud(mask=rsMask).generate(pageObj.extractText())
print(cloud)
plt.imshow(cloud, interpolation="bilinear")
plt.axis('off')
plt.show()