Разделение имен исполнителей из одного столбца - PullRequest
0 голосов
/ 01 марта 2019

Я извлекаю данные из списка billboard 100 и застрял в том, как разделить имена исполнителей.Это CSV-файл, но у меня есть данные в кадре данных Pandas перед экспортом.Я хотел бы разделить, используя python / pandas.Я включил изображение столбца ниже.Имена артистов находятся в одном столбце с разделителями (красным), которые я хотел бы разделить, но это очень сложно.Наиболее распространенными разделителями являются «&», «Featuring», «X», поэтому в основном мне нужна помощь по разбиению всех этих имен на разные столбцы.

Я думалЯ мог бы использовать вложенные для циклов, чтобы я мог разделить на комбинации этих разделителей.Моя идея состояла в том, чтобы разделить на основе шаблона "(символ)", "X", "x" и "Featuring", но я не уверен, возможно ли это.Есть ли более простой способ сделать это без потери данных?Вся помощь приветствуется.

1 Ответ

0 голосов
/ 01 марта 2019

Рассмотрим примерный фрейм данных df

df = pd.DataFrame({'singers': ['A & B', 'C Featuring D', 'E X F', 'G % H']})
df
    singers
0   A & B
1   C Featuring D
2   E X F
3   G % H

Теперь вам решать, какой разделитель вы хотите выбрать для разделения имен.Может быть просто X или просто Featuring или & или, может быть, все они.Используйте str.split для достижения этого, как показано -

df.singers.str.split('&|X|Featuring|%', expand=True)
    0   1
0   A   B
1   C   D
2   E   F
3   G   H

Вы можете даже добавить любой другой символ внутри метода split.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...