У меня есть текстовый файл с огромным текстом, написанным в виде абзацев.
Мне нужно сосчитать определенные части знаков препинания: ,
и ;
из этого текста без использования какого-либо модуля, даже regex
.
Кроме того, моя программа также должна считать '
и -
, но только при определенных обстоятельствах.
В частности, она должна подсчитывать '
отметок, но только тогда, когда они отображаются в виде апострофов, окруженных буквамито есть указание на сокращение, такое как «не должен» или «не будет» .(Апостроф включается в качестве указания на более неформальное письмо, возможно, прямую речь.) Кроме того, он должен считать -
знаков, но только тогда, когда они окружены буквами, указывающими составное слово, такое как "самооценка ".
Любые другие знаки препинания или буквы, например цифры, должны рассматриваться как пробел, поэтому служат для завершения слов.
Примечание : Некоторые изТексты, которые мы будем использовать, включают в себя двойной дефис, т.е. --
.Это следует рассматривать как пробел.
Сначала я создал строку и сохранил в ней некоторые знаки пунктуации, например punctuation_string = ";./'-"
, но это дает мне общее количество;то, что мне нужно, это считать индивидуальную пунктуацию.
Из-за этого я должен изменить certain_cha
переменное число раз.
with open("/Users/abhishekabhishek/downloads/l.txt") as f:
text_lis = f.read().split()
punctuation_count = {}
certain_cha = "/"
freq_coun = 0
for word in text_lis:
for char in word:
if char in certain_char:
freq_coun += 1
punctuation_count[certain_char] = freq_count
Мне нужно, чтобы значения отображались следующим образом
; 40
. 10
/ 5
' 16
и т. Д.но я получаю всего (71).