Попробуйте это:
1.) Удалить строку 1-23
df = pd.read_excel('/home/mayankp/Downloads/Example2.xlsx', sheet_name=0, index_col=None, header=None, skiprows=23)
2.) Разбить столбец B на несколько столбцов, используя «-» в качестве разделителя и 3.) Присвоить имена столбцов новым столбцам
Оба эти шага могут быть выполнены за один раз:
sub_df = df[1].str.split('-', expand=True).rename(columns = lambda x: "string"+str(x+1))
In [179]: sub_df
Out[179]:
string1 string2 string3 string4 string5
1 us campaign article1 scrolldown findoutnow
2 us campaign article1 scrollright None
3 us campaign article1 findoutnow None
4 us campaign payablesmanagement findoutnow None
Выше показано, как выглядит образец после разбиения на -
.
Теперь удалите фактический столбец из df
и вставьте в него новые столбцы:
df = df.drop(1, axis=1)
df = pd.concat([df,sub_df], axis=1)
4.) Сохранить числовые столбцы
Остальные столбцы уже не повреждены. Для этого не нужно никаких изменений.
Дайте мне знать, если это поможет.