Чтение всего диапазона строк из одного CSV-файла в Python с использованием панд - PullRequest
0 голосов
/ 03 сентября 2018

Я пытаюсь прочитать CSV-файл с помощью Python и Pandas, но мой файл имеет большой размер (1 ГБ), поэтому я не могу прочитать все данные. На этом веб-сайте я научился использовать nrows для чтения строк из моего файла, например, для чтения первых 75 строк, но я не могу прочитать диапазон строк.

dts = pd.read_csv('C:\DtsPMU\dts.csv', dtype=float , nrows=75)

Эта ссылка Python Pandas reads_csv пропускает первые x и последние y строк говорит, чтобы использовать такой код:

dts = pd.read_csv('C:\DtsPMU\dts.csv', dtype=float , skiprows=60, nrows=75)

С этим кодом я пытаюсь прочитать только диапазон строк (начиная с 60 до 75), но он не работает.

Как я могу прочитать диапазон строк из моего CSV-файла?

Я использую Python 3.6.5 и Pandas 0.23.2

1 Ответ

0 голосов
/ 03 сентября 2018

Этот код отлично работает

dts = pd.read_csv('C:\DtsPMU\dts.csv', dtype=float , skiprows=60, nrows=75)

Единственная проблема заключается в том, что в качестве заголовка используется строка с номером 60, если вы хотите использовать оригинальный заголовок, используйте

имена: как у массива, по умолчанию нет Список имен столбцов для использования. Если файл не содержит строку заголовка, то вы должны явно передать header = None. Дубликаты в этом списке приведут к выдаче предупреждения пользователя.

Например: если ваш файл имеет 3 столбца, то

dts = pd.read_csv('C:\DtsPMU\dts.csv', dtype=float , skiprows=60, nrows=75, names=[0,1,2])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...