У меня есть два списка: a
и b
. Они выглядят так:
a = [
'And',
"you're",
'going',
'to',
'use',
'some',
'handouts.',
'Okay.',
'So',
'I',
'needed',
'to',
'know',
'and',
'for,'
]
b = [
'And',
"you're",
'going',
'to',
'use',
'some',
'handouts.',
'Okay.',
'I',
'needed',
'to',
'know',
'and',
'for,',
'it'
]
Я хочу убедиться, что они могут складываться вместе и совпадать. Однако это не так, как показано здесь:
x = list(zip(a,b))
for i in x:
print(i)
('And', 'And')
("you're", "you're")
('going', 'going')
('to', 'to')
('use', 'use')
('some', 'some')
('handouts.', 'handouts.')
('Okay.', 'Okay.')
---> ('So', 'I')
('I', 'needed')
('needed', 'to')
('to', 'know')
('know', 'and')
('and', 'for,')
('for,', 'it')
Видно, что a
содержит 'So', а b
- нет. Чтобы исправить это, я хочу удалить 'So' из a
, что приведет к следующему:
('And', 'And')
("you're", "you're")
('going', 'going')
('to', 'to')
('use', 'use')
('some', 'some')
('handouts.', 'handouts.')
('Okay.', 'Okay.')
('I', 'I')
('needed', 'needed')
('to', 'to')
('know', 'know')
('and', 'and')
('for', 'for,')
('it,', 'it')
По сути, слово существует в одном списке, но не в другом списке в общей области индекса. , Я хочу удалить его, независимо от того, находится он в a
или b
. Я использовал библиотеку fuzzywuzzy для нечеткого сопоставления, которая работает неплохо, но очень медленно. Есть ли более эффективные способы сделать это?