DataFrame Pandas не создается должным образом - PullRequest
0 голосов
/ 28 октября 2018

У меня есть файл Excel, содержимое которого выглядит следующим образом:

        this is is the line we want to ignore
        id        name           dept               deptid
        2         abc                 it                   1
        3         xyz                 mech            2
        1         mno               stats             3

Обратите внимание, что первые 2 строки, которые мне нужно пропустить. Первая - это строка, а вторая - заголовок.

Я использую приведенную ниже команду,

      import pandas as pd
      pd.read_excel(my file, sheet_name=1, skip_rows=[ i for i in range(2)])

Все в порядке с выводом, за исключением того, что он преобразует первое значение столбца Deptid, которое составляет от 1 до 1,1

Если я даю любое другое числоон работает нормально.

Пожалуйста, подскажите, почему это происходит.

1 Ответ

0 голосов
/ 28 октября 2018

Открыть файл в Excel.Бьюсь об заклад, фактическое значение в первой ячейке для deptid составляет 1,1, но у вас есть некоторое форматирование, которое предотвращает отображение десятичных цифр.Таким образом, данные действительно 1.1, даже если Excel не показывает это таким образомКогда вы откроете файл и нажмете на ячейку, то увидите, что в текстовом редакторе действительно есть текст.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...