Я попытаюсь использовать простой пример для описания моей проблемы.
У меня есть CSV-файл со многими столбцами. Заголовок одного из столбцов - «имена».
В этом столбце «имена» мне нужны только те времена, когда имя «Джон» повторяется.
Например, мой столбец "имена" выглядит следующим образом:
names
John
John M
Mike John
Audrey
Andrew
Для этого случая мне понадобится скрипт на python, использующий pandas, чтобы получить значение 3, потому что слово «Джон» повторяется три раза.
Вот коды, которые я использую:
from_csv = pd.read_csv(r'csv.csv', usecols = ['names'] , index_col=0, header=0 )
times = from_csv.query('names == "John"').names.count()
Но он возвращает мне только 1, потому что есть только одна строка, в которой есть только Джон.
Я пытался использовать:
times = from_csv.query('names == "*John*"').names.count()
но безуспешно.
Как я могу получить 3 для этой конкретной ситуации? спасибо