Как использовать Панд с плавающими значениями - PullRequest
0 голосов
/ 01 апреля 2019

У меня есть данные из csv:

36849|17|4.7|20180118103240
36792|17|5.3|20180118103238

4.7 и 5.3 - это число с плавающей запятой

Но когда я делаю это так:

scores_data_train = pd.read_csv('../Dataset/TrainData//u.score.csv', sep='|')
scores_train = scores_data_train.as_matrix()
print(scores_train[:1, :])

Результат:

[[3.68490000e+04 1.70000000e+01 4.70000000e+00 2.01801181e+13]]

Пожалуйста, помогите мне.Спасибо

Ответы [ 2 ]

0 голосов
/ 01 апреля 2019

Метод as_matrix() превращает фрейм данных в пустой массив, который по определению ограничен одним типом данных. Вы не можете использовать некоторые элементы как числа с плавающей точкой, в то время как другие являются целыми числами.

До тех пор, пока вы не вызовете .as_matrix(), у вас будет кадр данных, который может содержать столбцы типа integer и float. Типы для каждого столбца можно указать, вызвав pd.read_csv(..., dtype={"colname": "int", "colname2": "float"}).

0 голосов
/ 01 апреля 2019

Пожалуйста, сделайте следующие настройки после импорта numpy. см. похожие вопросы, пожалуйста, проверьте

   import numpy as np  
   np.set_printoptions(suppress=True,
   formatter={'float_kind':'{:0.2f}'.format}) 

# число с плавающей запятой, 2 единицы # точность справа, 0 слева

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...