Я пытаюсь прочитать CSV-файл, используя панд в питоне. я сослался по этой ссылке pandas.read_csv перемещает имена столбцов на один
и использовал приведенный ниже код для отображения первой строки файла CSV.
prodid ProdParent productname StartDate wfStatus ErrorMessage
FCT TDAR 2752_bg42328_US 3/8/2019 15:21 "PROCESs IS empty"
VEE TNL 2752_bg42329_US 3/8/2019 15:26 "success"
FCT TRAD 2752_bg42328_US 3/8/2019 15:21 "PROCESs IS empty"
VEE TNL 2752_bg42329_US. 3/8/2019 15:32
VEE TNL 2752_bg42329_US 3/8/2019 15:34
VEE TNL 2752_bg42329_US 3/8/2019 15:38
JUR TLO 2755_bg567_US 4/8/2019 03:19
какитерация каждого n каждого ряда с помощью панд. в моем csv-файле, содержащем заголовочные столбцы, а именно errorMessage и productName, дату начала, wfstatus и т. д ... проблема, с которой я сталкиваюсь, состоит в том, что в моем csv-файле содержится около 8000 строк, и мне нужно отфильтровать / извлечь только те значения строк / столбцов сследующие условия:
если errorMessage_column_value == blank/null value
ИЛИ wfSTATUS_columnvalue == blank/null
, тогда извлеките соответствующее значение ячейки / столбца productName, где оно соответствует вышеуказанному условию.
сейчас, если существует несколько значений столбца productname с различнымивременной интервал на ту же дату существует (в столбце startdate), мне нужно получить ТОЛЬКО последнее / последнее значение productName.
как этого добиться.
df = pd.read_csv(csv_ctrl_file, index_col=False)
print(df.head(1))