У меня есть набор данных, и я хочу напечатать все предложения с наиболее частыми словами, такими как:
пример, представьте, что у меня есть это:
это частота моего набора данных
, и это мой исходный набор данных
Я хочу напечатать все предложения, содержащие (i), а затем удалить те извлечь предложения из набора данных
, затем начать с (вы) и распечатать все предложения, которые содержат (вы), а затем удалить (вы)
, но я хочу установить диапазон между ними, например, начать с ( частота от 600 до 100) не все они как это сделать
есть идеи как это сделать? мой набор данных .txt
я попробовал это: