Когда вы говорите матрица в python, я предполагаю, что вы имеете в виду df
. Если вы этого не сделаете и имеете в виду фактическую матрицу из numpy
массивов, вы можете легко получить ее из df
. Вместо того, чтобы копировать ваши значения из df
, просто отбросьте необходимые строки и сохраните оставшиеся в новом df
.
new_df = df.dropna(inplace=True,subset=["col9","col10"])
Подмножество - это столбцы, которые вы хотите учесть при отбрасывании. ( вы также можете передать индекс / номер столбца в списке) ^ это сохранит ваши данные, включая даты в новом df с пропущенными строками.
Чтобы преобразовать эту матрицу new_df
в numpy, вы можно легко загрузить его в словарь, используя:
DataFrame.to_dict(self, orient='dict', into=<class 'dict'>)[source]
метод, а затем, из этого, загрузить numpy мат (ссылка: python продиктовать numpy структурированный массив )
ПРИМЕЧАНИЕ: если даты доставляют вам дополнительные хлопоты, то конвертируйте их в число с плавающей точкой в самом new_df, используя:
def datetime_to_float(d):
return d.timestamp()