Я использую набор данных из Бюро статистики труда США.Конкретная таблица, с которой я работаю, это данные о заработной плате для разных профессий.Когда у конкретной профессии нет данных о заработной плате, они используют звездочки (то есть *), делая столбец смесью чисел и *.
Это заставляет панд преобразовать столбец в dtype=object
, и все числа становятся строками.Моя работа заключалась в том, чтобы приводить их к float (), когда мне нужно поработать с ними числами, но это все еще создает ненужное предварительное распределение памяти.Я прав в своих мыслях здесь?Если да, есть ли у кого-нибудь предложения о том, как улучшить это?