Применить scikit-learn murmurhash3_32 на информационном фрейме Pandas - PullRequest
0 голосов
/ 13 ноября 2018

Я пытаюсь применить мурмурхаш к кадру данных панд.Я хотел использовать scikit-learn murmurhash3_32 (было бы полезно любое другое простое предложение).Я пытался

import pandas as pd
from sklearn.utils.murmurhash import murmurhash3_32

df = pd.DataFrame({'a': [100, 1000], 'b': [200, 2000]}, dtype='int32')
df.apply(murmurhash3_32)

Но я получаю

TypeError: ("ключ 0 100 \ n1 1000 \ nName: a, dtype: int32 с классом типа" pandas.core.series.Series 'не поддерживается. Требуется явное преобразование в байты ",' произошло в индексе a ')

Но Scikit должен обрабатывать int32: https://scikit -learn.org /dev / modules / made / sklearn.utils.murmurhash3_32.html # sklearn.utils.murmurhash3_32

Есть идеи или рекомендации по этому поводу?

1 Ответ

0 голосов
/ 13 ноября 2018

Глупая ошибка, не уверен, что мне следует удалить мой вопрос:

Применить передаст последовательность функции.

Использование applymap работает, как и ожидалось, так как он передает каждый элемент в функцию.

...