Извлечение особых данных (Дата) - PullRequest
0 голосов
/ 28 января 2020

У меня есть набор данных с блок-схемой и грязной датой. date содержит год, месяц и день соответственно (4 цифры, 6 цифр, 8 цифр).

 Name Color date
0   K   A   2011
1   Y   B   201411
2   B   C   20151231
3   B   A   2019
4   C   B   201911
5   A   A   20120507
6   Q   G   20130601

Я хочу извлечь только набор данных для 2019 из этого набора данных (строка). Как я могу это сделать? Например, я хочу вывод, как показано ниже

 Name Color date
0   B   A   2019
1   C   B   201911

Ответы [ 2 ]

1 голос
/ 28 января 2020
df[df['date'].astype('str').str.startswith('2019')]

df содержит опубликованную вами таблицу / данные.

0 голосов
/ 28 января 2020

Не похоже, что ваш столбец даты непротиворечив, например, некоторые - год, другие - год и месяц. Если год - это всегда первые четыре цифры, вы можете сделать столбец строкой, срезом и отфильтровать нужный вам год, предполагая, что ваши данные называются 'df':

df['date'] = df['date'].astype(str)
year = df['date'].str.slice(0,4)
df[year == '2019']   # your desired rows
...