У меня есть шаблон csv, сохраненный в ADL. Я читаю этот шаблон и добавляю некоторые данные из фрейма данных и сохраняю их как файл с разделителями табуляции. Это работает, но у меня есть эти Nul знаки в начале и конце каждого ряда. Как я могу сохранить это без этих признаков.
Часть кода, который я использую:
def saveToSingleTxt(df, saveLocation):
txtLocation = saveLocation+'temp.folder'
fileLocation = saveLocation
df.coalesce(1).write.format("csv").option("header", "false").option("delimiter","\t").option("quote", "\u0000").option("charset","UTF-8").mode("overwrite").save(txtLocation)
file = dbutils.fs.ls(txtLocation)[-1].path
dbutils.fs.cp(file, fileLocation)
dbutils.fs.rm(txtLocation, recurse=True)
df = getDimContent(rootPayLoadDataV)
dftempV28 = sqlContext.read.format("com.databricks.spark.csv").option("header", "false").load(sourceADLSFullPathTemp + fileNameTempV28)
dftempV28 = dftempV28.replace('## SC\tD:YYYY-MM-DD hh:mm:ss\tA:300092594:128', '## SC\tD:' + str(curentDate.strftime("%Y-%m-%d %H:%M:%S")) + '\tA:300092594:128')
df = df.withColumn("KeyContentName", concat(df["ContentID"], lit("\t"), df["ContentName"]))
appendV28 = dftempV28.union(df.select(df["KeyContentName"]))
saveToSingleTxt(df, destinationADLSFullPath + fileNameV28)
Как я могу сохранить это без знака NUL ('\ x00' шестнадцатеричный) ? Спасибо!