Сохраняйте числа в виде чисел с плавающей точкой, если в столбце есть смесь чисел и звездочек (то есть *) - PullRequest
0 голосов
/ 25 апреля 2018

Я использую набор данных из Бюро статистики труда США.Конкретная таблица, с которой я работаю, это данные о заработной плате для разных профессий.Когда у конкретной профессии нет данных о заработной плате, они используют звездочки (то есть *), делая столбец смесью чисел и *.

Это заставляет панд преобразовать столбец в dtype=object, и все числа становятся строками.Моя работа заключалась в том, чтобы приводить их к float (), когда мне нужно поработать с ними числами, но это все еще создает ненужное предварительное распределение памяти.Я прав в своих мыслях здесь?Если да, есть ли у кого-нибудь предложения о том, как улучшить это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...