Я пишу пользовательский сканер, и мне нужно знать, сканируется ли определенный URL или нет, поэтому я не буду добавлять один и тот же URL дважды Прямо сейчас я использую mysql для хранения хеш-значений каждого URL. Но мне интересно, может ли это стать очень медленным, если у меня большой набор URL-адресов, скажем, сотни миллионов.
Есть ли другие способы хранения URL-адресов? Люди используют люцен для этого? Или есть конкретная структура данных для этого?