• 1000 1006 * Насколько я понимаю, NaN - это dtype с плавающей запятой.
В столбце A, как лучше всего представлять пустые значения, сохраняя тот же dtype в столбце? Я также хотел бы изменить '-' на пустые значения. Аналогичным образом в столбце B NaN (float) смешивается с JFK (строка). Какой лучший способ решить эту проблему?
В конце концов я хочу сделать pd.read_csv (, dtype = {'A': str, 'B': str, 'C': np.int32}) или что-то вроде того. Поправьте меня, если я тоже ошибаюсь.
Изменить:
test = pd.read_csv('test.csv', na_values='--', dtype = {'A':str, 'B': str, 'C':np.float64})
in: test
out:
A B C
0 alice JFK 0.25
1 bob NaN 0.50
2 NaN JFK NaN
3 NaN JFK 4.00
4 jeff JFK 12.20
5 NaN JFK 14.40
type(test.iloc[2]['A']) # float
type(test.iloc[1]['A']) # string
Это нормально, что это разные типы? Есть ли способ сделать оба строки? Или это даже не рекомендуется?