Я написал следующий код Python для Azure Databricks и пытаюсь запустить программу на кластере искр:
import polyglot
from polyglot.downloader import downloader
from polyglot.text import Text, Word
docx=Text(u"He likes reading and painting")
print(docx.words)
value = downloader.download("pos2.en")
print("Download valueL:", value)
print(docx.pos_tags)
Ниже показан вывод, который выдает ошибку Value в строке print(docx.pos_tags)
какниже:
[u'He', u'likes', u'reading', u'and', u'painting']
[polyglot_data] Downloading package pos2.en to /root/polyglot_data...
[polyglot_data] Package pos2.en is already up-to-date!
('Download valueL:', True)
ValueError: This resource is available in the index but not downloaded, yet. Try to run
Я установил PyICU==2.2
и pycld2==0.31
через упоминание пакета pypi в рабочей области блоков данных Azure.
Также не работает транслитератор.Кто-нибудь еще сталкивался с такой же проблемой?Может ли кто-нибудь помочь мне решить эту проблему?