Как разделить особенность в пандах - PullRequest
0 голосов
/ 12 сентября 2018

Это первые 5 примеров учебного комплекта, над которым я работаю.Я должен предсказать рейтинг, данный этим пользователем другой комедии в тестовом наборе.

Вот так выглядит тестовый набор, но без оценок:

Итак, у меня есть несколько вопросов:

1. Каков наилучший способ отделитьИдентификатор шутки в комик и локация.Например, Klint De Drunk - комик, Enugu 1 - локация

Каков наилучший подход для получения наилучшей точности прогноза при глубоком обучении?

Спасибо

     Viewers_ID    Joke_identifier              Response_ID         Rating
       0    A1  Klint De Drunk Enugu 1  A1_Klint De Drunk Enugu 1   0.11
       1    A1  Klint De Drunk Enugu 2  A1_Klint De Drunk Enugu 2   -4.64
       2    A1  Klint De Drunk PH 1     A1_Klint De Drunk PH 1      -3.39
       3    A1  Klint De Drunk PH 2     A1_Klint De Drunk PH 2      0.44
       4    A1  Klint De Drunk Lagos 1  A1_Klint De Drunk Lagos 1   -4.83
       5    A1  Klint De Drunk Lagos 2  A1_Klint De Drunk Lagos 2   -4.52

1 Ответ

0 голосов
/ 12 сентября 2018

для пункта 1:

использование:

df['Joke_identifier_new'] = df['Joke_identifier'].str.rsplit(n=2).str[0]
df['location'] = df['Joke_identifier'].str.rsplit(n=2).str[1:].str.join(' ')
print(df)

Однако вы должны создать новый столбец для разделения, не назначайте его обратно, так как второй код не даст желаемых результатов. После этого вы можете удалить исходные столбцы.

...