Составление списка слов в кадре данных - PullRequest
0 голосов
/ 13 января 2019

<html>
            <body>
            <table border=1>
            <tr>
            <th>label</th>
            <th>rev</th>
            </tr>
            <tr>
            <td>0</td>
            <td>[ story man unnatural feelings pig...] </td>
            </tr>
            <tr>
            <td>0</td>
            <td>[ airport starts brand new luxury ...] </td></tr>
            <tr>
            <td>0</td>
            <td>[ film lacked something couldnt pu...] </td></tr>
            <tr>
            <td>0</td>
            <td>[ sorry everyone know supposed art...] </td></tr>
            <tr>
            <td>0</td>
            <td>[ little parents took along theate..]</td></tr>
            </table>
            </body>
            </html>

ИЗОБРАЖЕНИЕ-> [1]: https://i.stack.imgur.com/j2EAK.jpg

Мой фрейм данных выглядит как выше, я попытался использовать приведенный ниже код, чтобы остановить его:

from nltk.stem.porter import PorterStemmer
ps=PorterStemmer()
da.rev=[ps.stem(word) for word in da.loc[:,'rev']]

но это снова привело к тому же кадру данных, не могу указать, что пошло не так. Любая помощь будет оценена по достоинству. Спасибо за ваше время

1 Ответ

0 голосов
/ 13 января 2019

Трудно сказать, не видя вашего точного кода, но если каждый элемент в серии представляет собой список строк, вы можете попробовать

da.rev.apply(lambda x: [ps.stem(word) for word in x])

...