Ошибка ключа 0 при работе с join () над сериями - PullRequest
0 голосов
/ 26 ноября 2018

Я получил эту серию панд под названием "tokenized_data"

enter image description here

Теперь я пытаюсь выполнить следующую операцию:

for i in range(len(tokenized_data)):
    tokenized_data[i] = ' '.join(tokenized_data[i])

Однако яЯ получаю ключ

Ошибка: 0

Любая помощь в этом отношении будет принята с благодарностью.Не уверен, где я иду не так.

Спасибо.

Ответы [ 2 ]

0 голосов
/ 26 ноября 2018

Спасибо, Джезраэль, за то, что сообщили мне, где я ошибался.

Я только что сделал небольшое изменение в коде после того, что было ....

<> tokenized_data= tokenized_data.reset_index(drop=True)

, которая помогла сбросить индекс, и мой код работал как чудо.

0 голосов
/ 26 ноября 2018

Вам необходимо:

tokenized_data =  tokenized_data.str.join(' ')

Или:

tokenized_data =  tokenized_data.apply(' '.join)

Проблема вашего решения заключается в том, что цикл tokenized_data[i] не может выбирать значения диапазона, поскольку значения индекса Series разные.

tokenized_data = pd.Series([['would','have','hard'], ['worth','seek']], index=[77,101])

for i in range(len(tokenized_data)):
    print (i)
    #cannot select index 0, because not exist (indices are `77` and `101`)
    print (tokenized_data[i])

Выбор по позиции должен работать здесь, но лучше использовать Series.str.join:

for i in range(len(tokenized_data)):
    tokenized_data.iloc[i] = ' '.join(tokenized_data.iloc[i])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...