Я работаю с базой данных, которая выглядит примерно так:
Review_ID Rating Year_Month Reviewer_Location
670772142 4 2019-4 Australia
670682799 4 2020-5 Philippines
670623270 4 missing United Arab Emirates
670607911 4 missing Australia
670607296 4 2014-11 United Kingdom
670591897 3 2016-12 Singapore
670585330 5 2019-4 India
Я впервые делаю что-либо с python, и у меня нет полной ясности в простом синтаксисе.
Моя цель - отделить месяцы от столбца «год-месяц» путем извлечения всех символов после символа «-» в строке и сохранения их в другом столбце (если только значение строки не «отсутствует». в этом случае это вообще не рассматривается.) Я пробовал несколько вещей, одна из которых:
yf=df['Year_Month']
while yf!='missing'
if '-' in yf:
store[0]=i
i+=1
store[1]=(i)
df['Month'] = store
else:
i+=1
store
Это вообще не работает. Это как раз то, с чем я сейчас возился, но я действительно приблизился к рабочему коду, но я просто не могу понять, как избавиться от «недостающих» данных.
Вопрос, который я в конечном итоге пытаюсь нужно решить: «Какой период года является пиковым временем для посетителей каждого тематического парка», поэтому, пожалуйста, учтите, что мне нужно в конце нанести на график результаты.