Я написал код для удаления всех строк с NaN в столбце category_id, который успешно удалил строки с NaN в столбце category_id:
#removal of rows in dataframe that have NaN values in 'category_id' column
#data = data[np.isfinite(data['category_id'])]
data = data[data['category_id'].notnull()]
print(data['category_id'].shape)
data.to_csv('dataset.csv', encoding='utf-8', index=False)
print(type(data['category_id']))
Вывод:
(778,)
<class 'pandas.core.series.Series'>
Затем я написал код для сохранения всех строк, которые имеют только значения, указанные в списке:
#selecting rows of the dataset whose 'category' column has values mentioned in a list
category_ids = [19, 22, 2, 30, 23]
data = data[data.category_id.isin(category_ids)]
print(data.shape)
data.to_csv('dataset.csv', encoding='utf-8', index=False)
Вывод:
(0, 164)
Итак, он создает пустой фрейм данных и CSV.Зачем?