Question

Я делаю некоторые практические занятия в Интернете на python для nltk.

Задача состоит в том, чтобы отфильтровать слова из полного набора Text6, имеющие первую букву в верхнем регистре и все другие буквы в нижнем регистре.Выведите количество присутствующих слов.

Может кто-нибудь, пожалуйста, помогите сказать точный ответ (как это стандартный текст из книги NLTK) и что не так в коде.

Я попробовал ниже код:

from nltk.book import text6
import re
pattern = '[A-Z]+[a-z]+$'
capsword= [word for word in set(text6) if re.search(pattern, word)]
print(len(capsword))

Мой фактический вывод - 461. Но я не уверен в ожидаемом выводе, так как он скрыт.

Gopesh · Answer 1 · 03 апреля 2019

Я изменил шаблон (чтобы включить специальные символы, такие как ABC! Или ABC.), И это сработало:

from nltk.book import text6
import re
pattern = '[A-Z][a-z*]'
a = [word for word in set(text6) if (re.search(pattern, word))]
print(len(a))

имея первую букву в верхнем регистре и все другие буквы в нижнем регистре в text6 из nltk

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

имея первую букву в верхнем регистре и все другие буквы в нижнем регистре в text6 из nltk

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов