Эффективное преобразование кадра данных в список в большом наборе данных - PullRequest
0 голосов
/ 17 мая 2018

У меня есть следующий код, который читает в CSV-файл (в dataset DataFrame) и преобразовать его в список (в transactions список) для обработки с помощью алгоритма apriori.

import pandas as pd

dataset = pd.read_csv('datasetFile.csv')
transactions = []
num_rows = 8000
num_cols = 20
for i in range(0, num_rows):
    transactions.append([str(dataset.values[i,j]) for j in range(0, num_cols)])

Формат файла .csv - 8000 строк, максимум 20 товаров в строке:

bread, butter
bread, milk, eggs, fruit
milk
eggs, milk, bread

Приведенный выше код Python работает для этого небольшого набора данных. Тем не менее, мой текущий набор данных имеет около 300 тыс. Строк и 300 столбцов. Как я могу улучшить этот кусок кода Python, чтобы преобразовать большой DataFrame в список?

1 Ответ

0 голосов
/ 17 мая 2018

Мне кажется, нужны значения фильтров, преобразовать их в массив numpy, а затем в список:

transactions = dataset.iloc[:num_rows, :num_cols].astype(str).values.tolist()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...