У меня есть серия больших текстовых документов. Мне нужно прочитать их и - если появляется определенное слово - извлечь все предложение.
Итак, если я ищу слово wobble
и предложение в документе - Weebles wobble but they don't fall down
, я хочу извлечь это предложение.
Какой самый эффективный способ сделать это?
Я могу придумать два подхода к этому:
Искать в документе слово, затем извлечь конкретное предложение; или
Итерация по каждому предложению в документе. Проверьте каждое предложение на слово. Если в предложении есть слово, извлеките его.
Я бы подумал, что 1 эффективнее в вычислительном отношении, чем 2. Но не уверен, какой будет синтаксис.
Есть ли другой подход, который я не рассматриваю?
Любая помощь по эффективности и синтаксису приветствуется.