У меня есть фрейм данных, который содержит данные пользователя.Существует столбец, который содержит имена файлов, к которым обращались пользователи.Имена файлов выглядят так:
blah-blah-blah/dss_outline.pdf
doot-doot/helper_doc.pdf
blah-blah-blah/help_file.pdf
Моя цель состоит в том, чтобы отрубить все после и включая /, чтобы я мог просто посмотреть на программы верхнего уровня, которые изучают люди (которые организованы из множества различных файлов)under).
Итак, у меня две проблемы:
1 - Как мне «схватить» все до «/»?Я смотрю на регулярные выражения, но мне трудно написать правильное выражение.
2 - Как заменить все имена файлов на объединенные имена файлов?Я обнаружил, что могу использовать df['Filename'] = df['Filename'].str.split('/')[0]
, чтобы получить правильную часть, но это не будет применяться ко всему объекту серии.Это логика того, что я хочу сделать, но я не могу понять, как это сделать.
Спасибо