В соответствии с вашим кодом, кажется, что ваш df_MA
фрейм данных создается pandas
в блоках данных, потому что нет функции to_excel
для фрейма данных PySpark, и блоки данных не поддерживают преобразование фрейма данных PySpark в файл Excel, как показано на рисунке ниже в качестве моего эксперимента.
Поэтому я напрямую записываю pandas
фрейм данных df
в файл Excel test.xlsx
в текущем рабочем каталоге, как показано на рисунке ниже.
Затем я попытался запустить код, подобный вашему df_MA.to_excel("/dbsf/PATH/test.xlsx")
, но там проблема в том, что родительский путь должен быть /dbfs
, bnot /dbsf
, как показано на рисунке ниже.
Поэтому, когда вы пытались написать файл в несуществующий каталог PATH
, он не будет работать. Как показано на моем рисунке ниже, необходимо сначала создать новый каталог с именем PATH
, когда вы будете sh по пути /dbfs
, он работает.
Обновление: я тестирую на открытие и изменение файла test.xlsx
, используя openpyxl
, как код и рисунок ниже.
# Load test.xlsx and modify the `A1` cell
import openpyxl
wb = openpyxl.load_workbook('/dbfs/PATH/test.xlsx')
ws = wb.active
for row in ws.iter_rows():
print([col.value for col in row])
ws['A1']='A1'
wb.save('/dbfs/PATH/test.xlsx')
# Load its modified version and print values
wb = openpyxl.load_workbook('/dbfs/PATH/test.xlsx')
ws = wb.active
for row in ws.iter_rows():
print([col.value for col in row])
Просто перезапишите файл с тем же именем.