У меня есть двумерный массив, в котором каждый элемент представляет собой пару из двух тегов, например ["NOUN", "VERB"], и я хочу подсчитать, сколько раз каждая из этих уникальных пар встречается в большом наборе данных.
До сих пор я пытался использовать defaultdict (int) и Counter (), чтобы просто добавить элемент, если ранее не был найден или, если найден, увеличить значение на 1.
dTransition = Counter()
# dTransition = defaultdict(int)
# <s> is a start of sentence tag
pairs = [[('<s>', 'NOUN')], [('CCONJ', 'NOUN')], [('NOUN', 'SCONJ')], [('SCONJ', 'NOUN')]]
for pair in pairs:
dTransition[pairs] += 1
Это не работает, так как не принимает два аргумента. Поэтому мне интересно, есть ли простой способ проверить словарь, если ключ, который является двумерным массивом, уже существует, и если это так, увеличить значение на 1.