'У меня есть список подстрок (каждая может содержать несколько токенов). Я хочу найти в тексте в качестве примера, скажем, мой список подстрок:
[
'apple',
'banana smoothie',
'citrus orange fruit'
]
У меня также есть список фрагментов текста, который может не содержать ни одной, некоторых или всех подстрок, вот несколько возможных примеров:
[
'I like apple',
'I like apple and banana smoothie',
'I like banana smoothie, apple and citrus orange fruit',
'I like none',
'I like citrus orange fruit and apple'
]
Я хочу вернуть экземпляры подстрок, упомянутых в каждом тексте, и что в порядке их появления, поэтому для этого примера вывод, который я хочу получить, будет:
[
['apple']
['apple', 'banana smoothie'],
['banana smoothie', 'apple', 'citrus orange fruit'],
[],
['citrus orange fruit', 'apple']
]
Я могу только представить, что могу сделать это с помощью какого-то подхода со скользящим окном, но я надеюсь, что есть более простое решение