Как удалить строку фрейма данных, если в столбце предложения меньше 4 символов? - PullRequest
0 голосов
/ 18 февраля 2020

допустим, у меня уже есть токенизированное предложение в моем фрейме данных, например:

+-----------------------------------------+-----------+
|                sentence                 | sentiment |
+-----------------------------------------+-----------+
| [i, like, this, app, it, s, awesome]    | positive  |
| [way, to, many, ads, pop, up, hate, it] | negative  |
| [ye]                                    | negative  |
| [p]                                     | positive  |
| [niceeeee]                              | positive  |
| [i, do, not, like, the, design]         | negative  |
| [very, useful, recommended]             | positive  |
| [ugly]                                  | negative  |
| [xxx]                                   | negative  |
| [yes]                                   | positive  |
+-----------------------------------------+-----------+

Я хочу удалить ненужные данные из фрейма данных, удалив строку df, если в предложении меньше 4 символов Таким образом, конечный результат будет выглядеть следующим образом:

+-----------------------------------------+-----------+
|                sentence                 | sentiment |
+-----------------------------------------+-----------+
| [i, like, this, app, it, s, awesome]    | positive  |
| [way, to, many, ads, pop, up, hate, it] | negative  |
| [niceeeee]                              | positive  |
| [i, do, not, like, the, design]         | negative  |
| [very, useful, recommended]             | positive  |
| [ugly]                                  | negative  |
+-----------------------------------------+-----------+

Кто-нибудь может предоставить программный код для решения этой проблемы? я буду очень признателен за вашу помощь, она поможет моей дипломной работе, спасибо за ваше внимание

1 Ответ

1 голос
/ 18 февраля 2020

Вы можете использовать apply функцию для этого

char_limit=4
df[df['sentence'].apply(lambda x : len("".join(x))>=char_limit)]
...