Удаление диапазонов символов в индексе данных панд - PullRequest
0 голосов
/ 13 апреля 2019

У меня есть список текстовых элементов в столбце данных, некоторые из которых содержат целые числа в конце, а некоторые содержат информацию в скобках "(дополнительная информация)".Остальные элементы - просто плоский текст.Я хочу удалить все целые числа из тех, у которых они есть, и весь парантез с их информацией внутри, сохраняя при этом значение, после которого оно находится.

             Cost   Item Purchased  Name
Store1       22.5   Sponge          Chris
Shop         2.5    Kitty Litter    Kevyn
House (aax)  2  Spoon               Filip

Я бы хотел, чтобы вывод был

           Cost Item Purchased  Name
Store      22.5 Sponge          Chris
Shop       2.5  Kitty Litter    Kevyn
House      2    Spoon           Filip

1 Ответ

0 голосов
/ 14 апреля 2019

Настройка фрейма данных.Было бы полезно в будущем, если вы поставите это в вопросе.

df = pd.DataFrame(
    {
        "cost": [22.5, 2.5, 2],
        "item purchased": ["Sponge", "kitty litter", "spoon"],
        "name": ["Chris", "Kevyn", "Filip"],
    },
    index=["Store1", "Shop", "House (aax)"],
)


# reset the index to a column.
df=df.reset_index()

# split the index and keep the first item in the lists.
df['index'] = df['index'].str.split("(").map(lambda x: x[0])

# reset the index
df = df.set_index('index')

print(df)

        cost    item purchased  name
index           
Store1  22.5    Sponge          Chris
Shop    2.5     kitty litter    Kevyn
House   2.0     spoon           Filip
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...