Question

Я хочу суммировать количество частот каждого слова в моем списке в строке.Как я могу сделать ?Подробности:

list = ['Apple', 'Mango' ,'Orange','p[éeêè]t[s]' ]
text = 'I have Apple and mood today, This morning i ate mango and pret then Orange'

В этом случае я хочу вернуть 4.

rnso · Answer 1 · 17 апреля 2019

Вы можете преобразовать текст в список, а затем перебрать каждое слово в этом списке. Увеличьте счетчик, если в вашем списке есть слово:

words = ['Apple', 'Mango', 'Orange' ]
text = 'I have Apple and Mango mood today, This morning i ate Mango and then Orange'

textlist = text.split(" ")  # split text to words;
counter = 0
for word in textlist:
    if word in words:
        counter+=1 
print(counter)

Выход:

Добавлен следующий код для удаления запятой и точек в конце слов:

textlist = text.split(" ")
print(textlist)
counter = 0
for word in textlist:
    if word[-1] in [',','.']:  # if last character is comma or period
        word = word[:-1]       # remove last character
    if word in words:
        counter+=1 
print(counter)

brunns · Answer 2 · 17 апреля 2019

Попробуйте:

import re
len([word for word in text.split() if any(re.match(pattern, word) for pattern in list)])

han solo · Answer 3 · 17 апреля 2019

Вы можете получить frequency каждого слова, используя dict comprehsnion, И затем, sum values, чтобы получить общее количество,

>>> list_
['Apple', 'Mango', 'Orange']
>>> text
'I have Apple and Mango mood today, This morning i ate Mango and then Orange'
>>> y = {x: text.count(x) for x in list_}
>>> y
{'Orange': 1, 'Mango': 2, 'Apple': 1}
>>> sum(y.values())
4

После того, как вопросы изменены, вам нужно что-то вроде этого,

>>> import re
>>> list_ = ['Apple', 'Mango' ,'Orange', 'pr[éeêè]t[s]?' ]
>>> text
'I have Apple and mood today, This morning i ate mango and pret then Orange'
>>> re.findall(r'|'.join(list_), text)
['Apple', 'pret', 'Orange']
>>> len(re.findall(r'|'.join(list_), text))
3

А если вам нужен frequencies каждого word, то используйте Counter из модуля collections,

>>> from collections import Counter
>>> Counter(re.findall(r'|'.join(list_), text))
Counter({'Orange': 1, 'pret': 1, 'Apple': 1})

И для случая insensitive Поиск,

>>> Counter(re.findall(r'|'.join(list_).lower(), text.lower()))
Counter({'orange': 1, 'pret': 1, 'mango': 1, 'apple': 1})
>>> d = Counter(re.findall(r'|'.join(list_).lower(), text.lower()))
>>> sum(d.values())
4

CoryKramer · Answer 4 · 17 апреля 2019

Вы можете использовать от str.count до sum с выражением генератора.

>>> words = ['Apple', 'Mango', 'Orange' ]
>>> text = 'I have Apple and Mango mood today, This morning i ate Mango and then Orange'
>>> sum(text.count(word) for word in words)
4

Подсчитайте частоту каждого слова моего списка в заданной строке

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Подсчитайте частоту каждого слова моего списка в заданной строке

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы