Я использую бесплатный FTP-сервер на dlptest 1 , и я сохранил CSV-файл в домашнем каталоге. Как я могу получить файл csv и загрузить его в фрейм данных, используя pyspark с этого ftp-сервера?
Я попробовал следующее:
ff= spark.read.csv("<a href="ftp://dlpuser@dlptest.com:SzMf7rTE4pCrf9dV286GuNe4N@ftp.dlptest.com/xyz.csv" rel="nofollow noreferrer">ftp://dlpuser@dlptest.com:SzMf7rTE4pCrf9dV286GuNe4N@ftp.dlptest.com/xyz.csv</a>")
, но выдает ошибку: "org. apache .had oop .fs.ftp.FTPException: Не удалось получить домашний каталог "
Я использую pyspark в автономном режиме с ноутбуком jupyter.