У меня есть этот огромный отсортированный по алфавиту индекс, и мне нужно получить строки для конкретных терминов.Чтение файла построчно и проверка, правильно ли я получил термин, кажется мне неэффективным, поэтому размер индекса (мы проиндексировали англоязычный корпус Википедии).
Поэтому я ищу способсделать бинарный поиск по строкам.Я использую LineNumberReader для эффективного получения количества строк, но, похоже, не существует эффективного решения для получения n-й строки из файла.
Мне интересно, можно ли читать строки, пока я не достигну n 'ая строка, проверка правильности термина и выполнение действий в соответствии с алгоритмом бинарного поиска (возможно, чтение строк снова, потому что мне нужна строка, которую я уже пропустил) более эффективна, чем просто проверка терминов строка за строкой?
Любые другие предложения также приветствуются!
Обратите внимание, что мне нужно получить набор строк, в зависимости от набора условий для поиска.