Используйте пару вложенных циклов for.
Простейшая версия:
for a in sent:
for b in sent:
...
Пропуск идентичных пар (расстояние Левенштейна было бы тривиально 0):
for a in sent:
for b in sent:
if a != b:
...
Избегайте обработки повторяющихся пар (a, b
совпадает с b, a
):
for i in range(0, len(sent)):
for j in range(i+1, len(sent)):
# a = sent[i], b = sent[j]
...
Проблема: feature_sim
- это список , который может быть проиндексирован только целыми числами, а не строками или любыми другими типами.
Используйте словарь вместо:
feature_sim = {}
for i in range(0, len(sent)):
for j in range(i+1, len(sent)):
feature_sim[(sent[i], sent[j])] = pylev.levenshtein(sent[i], sent[j])