У меня есть список пар слов на исландском языке, которые пишутся одинаково, но означают разные вещи (например, лейти и лейти, киркья и киркья). Список - это просто список элементов, а не список кортежей (поэтому просто [leyti, leiti, kyrkja, kirkja]). Я использую большой корпус, чтобы получить частоту каждого слова, так что я мог бы получить, например, лейти = частота 3000, лейти = частота 500 и т. Д. Я хочу сохранить эти пары при получении частоты из корпуса. В данный момент я перебираю список слов и сравниваю каждое слово со списком частот из большого корпуса, что приводит к появлению словаря f.ex. {leyti: 3000, leiti: 500} и т. д. Итак, в основном я делаю это:
def findfreq():
freqdic = findfreq() # a dictionary with all the words in the corpus and their frequencies
ywords = listofwords() # the list of words
yfreq = {} # resulting dictionary with the word from the wordlist and it's frequency as it is in the corpus
for i in ywords:
for key, value in freqdic.items():
if i == key:
yfreq[i] = value
return yfreq
Но я не хочу просто словарь со всеми словами по отдельности, я хочу что-то (кортеж?)это представляет пару с обеими частотами (например: (лейти: 3000, лейти: 500), (киркья: 400, киркья: 600)). Как я могу это сделать?