Прочитать файл CSV и выполнить анализ данных без использования таких библиотек, как Numpy и Pandas? - PullRequest
0 голосов
/ 28 марта 2019

Это часть моего интервью.Я не могу найти никаких ресурсов, где я могу создать свой Dataframe в Python без использования Pandas или Numpy.Мне любопытно узнать, как создать Datframe из CSV без использования библиотек и выполнить анализ данных.Любые указания будут полезны.

1 Ответ

0 голосов
/ 28 марта 2019

Скорее всего, потребуется библиотека для чтения файла CSV. Хотя вы можете самостоятельно открывать и анализировать данные, это будет утомительно и отнимает много времени. К счастью, python поставляется со стандартным модулем csv, который вам не понадобится устанавливать pip! Вы можете прочитать свой файл так:

import csv

with open('file.csv', 'r') as file:
    my_reader = csv.reader(file, delimiter=',')
    for row in my_reader:
        print(row)

Это покажет вам, что каждый row читается как список. Затем вы можете обработать его на основе индекса! Есть и другие способы чтения данных, как описано в https://docs.python.org/3/library/csv.html, один из которых создаст словарь вместо списка!

обновление

Вы связали свой GitHub для проекта, который я взял снип

product_id,product_name,aisle_id,department_id
9327,Garlic Powder,104,13
17461,Air Chilled Organic Boneless Skinless Chicken Breasts,35,12
17668,Unsweetened Chocolate Almond Breeze Almond Milk,91,16
28985,Michigan Organic Kale,83,4
32665,Organic Ezekiel 49 Bread Cinnamon Raisin,112,3
33120,Organic Egg Whites,86,16
45918,Coconut Butter,19,13
46667,Organic Ginger Root,83,4
46842,Plain Pre-Sliced Bagels,93,3

Сохранил его как file.csv и запустил с кодом выше, который я разместил. Результат:

['product_id', 'product_name', 'aisle_id', 'department_id']
['9327', 'Garlic Powder', '104', '13']
['17461', 'Air Chilled Organic Boneless Skinless Chicken Breasts', '35', '12']
['17668', 'Unsweetened Chocolate Almond Breeze Almond Milk', '91', '16']
['28985', 'Michigan Organic Kale', '83', '4']
['32665', 'Organic Ezekiel 49 Bread Cinnamon Raisin', '112', '3']
['33120', 'Organic Egg Whites', '86', '16']
['45918', 'Coconut Butter', '19', '13']
['46667', 'Organic Ginger Root', '83', '4']
['46842', 'Plain Pre-Sliced Bagels', '93', '3']

Это делает то, что вы спросили в своем вопросе. Я не собираюсь делать ваш проект для вас, вы должны быть в состоянии обработать его отсюда.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...