При попытке импортировать коалы из блоков данных я вижу следующую ошибку. Я использую pyspark v2.4.5 и могу успешно подключиться к своему кластеру Spark. Кажется, что использование python 3.5 и подключение к Databricks Runtime 5.x работает. Я создал чистую виртуальную среду и установил коалы через conda install -c conda-forge koalas
. Я также попытался откатить kolas к более ранней версии, но безрезультатно. Пожалуйста, дайте мне знать, если я могу помочь предоставить дополнительную информацию.
File "C:/...", line 1, in <module>
import databricks.koalas as ks
File "C:\ProgramData\Anaconda3\envs\...\lib\site-packages\databricks\koalas\__init__.py", line 55, in <module>
from databricks.koalas.frame import DataFrame
File "C:\ProgramData\Anaconda3\envs\...\lib\site-packages\databricks\koalas\frame.py", line 78, in <module>
from databricks.koalas.plot import KoalasFramePlotMethods
File "C:\ProgramData\Anaconda3\envs\...\lib\site-packages\databricks\koalas\plot.py", line 22, in <module>
from matplotlib.axes._base import _process_plot_format
ModuleNotFoundError: No module named 'matplotlib.axes'