У меня есть фрейм данных, который состоит из нескольких выбранных столбцов из таблицы Excel.
xls_file = pd.ExcelFile('seedtestexcelbytask.xls')
writer = ExcelWriter('DFExport.xls')
df = xls_file.parse(usecols=[2, 3, 15])
Это небольшой пример фрейма данных
2 3 15
True 2/2/18 Seed 2 2in Holon, 83/1/2
True 2/3/18 Seed 1 1in Holon, 83/5
True 2/5/18 Seed 2 1.5in Holon, 26/1/2, 21/2, RW/1/2, H/7
В столбце 15 содержатся разные значения, некоторые разделены пробелом, некоторые запятыми, а некоторые косой чертой.пример
Seed 2 1.5in Holon, 26/1/2, 21/2, RW/1/2, H/7
В основном я пытаюсь переформатировать df
, читая строку, удерживая значение даты в столбце 3, затем анализируя ячейку в строке в столбце 15 и разбивая эту ячейкудалее добавляя дату и некоторое значение в следующую строку
2/2/18 83 1
2/2/18 83 2
2/3/18 83 5
2/5/18 26 1
2/5/18 26 2
2/5/18 21 2
2/5/18 RW 1
2/5/18 RW 2
2/5/18 H 7
Я пробовал варианты с xlrd и xlwt, но обнаружил, что просто продолжаю добавлять вложенные циклы, но я не думаю, что это наиболее эффективноспособ сделать это или это?Я нашел панд iterrows()
, но мне трудно пытаться понять, как получить результат, который я хотел бы с этим.Я не думаю, что мне нужен какой-то код, который я могу копировать и вставлять, но, будучи новичком в Python, мне, очевидно, трудно правильно реализовать панд.Будучи новичком в Python, любые указатели будут великолепны !!