У меня есть пандас DataFrame, содержащий следующие столбцы (с существующим числовым индексом):
points | variety
----------------
1 97 | Chardonnay
17 67 | Cabernet Sauvignon
12 70 | Cabernet Sauvignon
8 97 | Chardonnay
Я хотел бы преобразовать это в новый DataFrame с:
- Столбец
points
как новый индекс
- Один столбец для каждой уникальной записи в столбце
variety
- Значения в новых столбцах с названием сорта, в которых указана частота, с которой встречался каждый сорт для исходного значения
points
в исходной таблице.
например. из приведенного выше примера:
Chardonnay | Cabernet Sauvignon
-------------------------------
97 2 | 0
67 0 | 1
70 0 | 1
Обратите внимание, что исходный индекс не имеет отношения к выводу. Вот изображение, показывающее более полный пример: Pandas DataFrame Snapshot .