Преобразование типов данных в pandas и удаление ненужных строк - PullRequest
0 голосов
/ 07 февраля 2020

Я хотел бы удалить ненужные строки в файле, но типы данных в моих необработанных данных указаны как объект. Я пытался преобразовать его, используя .astype, однако он не сработал.

df = pd.read_csv(raw_data, header=None) 
print(df.dtypes) headers = ['random'] 
print("headers\n", headers) 
df.columns = headers print(df.dtypes)

введите описание изображения здесь

Мне нужны только те данные, которые выглядит так:

::rc=80000000:lq=135:ct=31D2

все остальное не нужно.

1 Ответ

0 голосов
/ 07 февраля 2020

Тип object - это то, как Pandas хранит строки (до недавнего выпуска v1, но, тем не менее, для ваших целей тип не является object). Когда вы говорите, что хотите, чтобы данные выглядели как эта строка, это зависит от того, насколько конкретно вы должны быть c. Если достаточно проверить строки, которые имеют ::rc=, вы можете сделать что-то вроде этого:

df[df.random.str.contains('::rc=')]

В противном случае вы можете использовать более сложный шаблон регулярных выражений, чтобы получить именно те строки, которые вам нужны.

...