Я скачал файл заголовков статей в Википедии, который содержит название каждой статьи в Википедии.Мне нужно найти все заголовки статей, которые могут быть возможными.Например, у меня могло бы быть слово "хоккей", но статья Wikipedia для хоккея, которую я хотел бы, - "Ice_hockey".Это также должен быть поиск без учета регистра.
Я использую Python, и есть ли более эффективный способ, чем просто построчный поиск?Я буду выполнять этот поиск как 500 или 1000 раз в минуту в идеале.Если строка за строкой - мой единственный вариант, могу ли я выполнить некоторые оптимизации в этом случае?
Я думаю, что в файле несколько миллионов строк.
Есть идеи?
Спасибо.