Хэшируйте каждый элемент списка строк в столбце Dataframe панд - PullRequest
0 голосов
/ 28 сентября 2019

Итак, у меня есть такой фрейм данных

   customer     location       trip_len
0     a      ['1', '2', '3']      3
1     b      ['4', '5']           2

И я пытаюсь хэшировать для каждой строки каждый элемент в списке строк в столбце 'location', чтобы повысить эффективность моегомодель.Как это возможно?

1 Ответ

0 голосов
/ 28 сентября 2019

Списки изначально не могут быть хэшируемыми, так как это изменяемые объекты.Если интерес представляет только хранилище, возможно преобразование в tuple.

df.location = df.location.apply(lambda locations: hash(tuple(locations)))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...