Объединение данных из разных строк на основе содержимого ячейки и создание новых столбцов на основе значений ячейки с помощью pandas и python - PullRequest
0 голосов
/ 06 ноября 2019

У меня есть данные в CSV-файле, где в каждом ряду есть название, фрукт и количество, связанное с фруктом. То, что я хочу, это объединить данные из разных строк в одну строку, где все суммы для фруктов, связанных с определенным именем, находятся под одной строкой.

У меня проблемы с нахождением правильного способа чтения всех данных из столбца фруктов и преобразования этих значений фруктов в отдельные строки.

Также нулевые значения должны быть преобразованы в ноль (но этоэто может быть довольно легко).

Я использую фрейм данных Python и Pandas, но я довольно новичок в кодировании и пандах, поэтому я не настолько знаком, как это делать. это пример данных, которые у меня есть.

name, fruit,     amount
Mike, Banana,    2
Mike, Kiwi,      3
Anna, Apple,     10
Anna, Banana,    20
Anna, Pineapple, 40
Bert, Pineapple, 100

И это формат, который я хочу, чтобы это было:

name, Banana, Kiwi, Apple, Pineapple
Mike, 2,      3,    0,     0
Anna, 20,     0,    10,    40
Bert, 0,      0,    0,     100

1 Ответ

0 голосов
/ 06 ноября 2019

Попробуйте использовать сводную таблицу, если хотите изменить структуру данных.

df.pivot(index='name', columns='fruit', values='amount')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...