У меня есть DataFrame, где я заменил некоторые отсутствующие значения поля на «N / A», например .na.fill("N/A", naColumns)
.Однако, когда данные копируются из S3 в RedShift, я получаю сообщение об ошибке: Invalid timestamp format or value [YYYY-MM-DD HH24:MI:SS]
Я понимаю, что, вероятно, не самая лучшая идея заполнять поля отметок времени строковыми значениями.Однако, если я не заменяю нулевые значения в DataFrame, я получаю сообщение об ошибке, что разделитель не найден при копировании в RedShift.Что, скорее всего, указывает на отсутствующие столбцы.
Кстати, поля не являются частью первичного ключа и являются nullable
.
Каков наиболее подходящий способ заполнения пустых значений полей timestamp
на стороне DataFrame?