Не совсем понятно, что вы здесь ищете. Но вот моя лучшая интерпретация.
Настройка:
df = pd.DataFrame({
"Filename": ["doc-hi.txt", "oh-my-god.txt"],
"Path": ["C:\asdf\asdf\asdf\kd.txt", "C:\asdcsc.docx"]
})
Отдельные строки
# "separate the values in 'Filename' column into strings based on '-' and '.' and also remove the extension name"
df["Filename_split"] = df["Filename"].apply(lambda _: os.path.splitext(_)[0]).str.split(r'\.|-')
# "separate the values in 'Path' column into strings based on '\' and ':'"
df["Path_split"] = df["Path"].str.split(r'\\|:')
Промежуточный Вывод
Filename Path Filename_split Path_split
0 doc-hi.txt C:sdf\sdf\sdf\kd.txt [doc, hi] [C, , asdf, asdf, asdf, kd.txt]
1 oh-my-god.txt C:sdcsc.docx [oh, my, god] [C, sdcsc.docx]
Объединение токенов вместе
Чтобы объединить список строк обратно вместе в отдельные строки, вы str.join
:
df['Filename_split'].str.join(' ')
df['Path_split'].str.join(' ')