получить раздел строки из столбца в python - PullRequest
1 голос
/ 07 августа 2020

Я работаю с базой данных, которая выглядит примерно так:

Review_ID   Rating  Year_Month  Reviewer_Location
670772142   4   2019-4  Australia
670682799   4   2020-5  Philippines
670623270   4   missing United Arab Emirates
670607911   4   missing Australia
670607296   4   2014-11 United Kingdom
670591897   3   2016-12 Singapore
670585330   5   2019-4  India

Я впервые делаю что-либо с python, и у меня нет полной ясности в простом синтаксисе.

Моя цель - отделить месяцы от столбца «год-месяц» путем извлечения всех символов после символа «-» в строке и сохранения их в другом столбце (если только значение строки не «отсутствует». в этом случае это вообще не рассматривается.) Я пробовал несколько вещей, одна из которых:

yf=df['Year_Month']

while yf!='missing'
    if '-' in yf:
        store[0]=i
        i+=1
        store[1]=(i)
        df['Month'] = store
    else:
        i+=1
store

Это вообще не работает. Это как раз то, с чем я сейчас возился, но я действительно приблизился к рабочему коду, но я просто не могу понять, как избавиться от «недостающих» данных.

Вопрос, который я в конечном итоге пытаюсь нужно решить: «Какой период года является пиковым временем для посетителей каждого тематического парка», поэтому, пожалуйста, учтите, что мне нужно в конце нанести на график результаты.

Ответы [ 2 ]

0 голосов
/ 07 августа 2020
df = {'Year_Month':['2019-4','2020-5','missing','missing','2014-11','2016-12','2019-4']}

d = pd.DataFrame(df)

for ym in df['Year_Month']:
    if ym != 'missing':
        year,month = ym.split('-')
        print(year,month)
0 голосов
/ 07 августа 2020

Вы можете попробовать использовать str.replace здесь:

df['Year']  = df['Year_Month'].str.replace('-.*$', '');
df['Month'] = df['Year_Month'].str.replace('^\d+-', '');

Обратите внимание, что, поскольку строковое значение missing не соответствует ни одному шаблону регулярного выражения, в этом случае отсутствующее значение Year_Month будет назначать missing в столбцы года и месяца.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...