Эффективные способы анализа файла фиксированной ширины и поиска определенных данных - PullRequest
0 голосов
/ 19 сентября 2019

Я новичок в Java.У меня есть требование прочитать большой текстовый файл, который содержит записи от 50К до 100К.Определенно ниже 1 ГБ.Это файл информации о продуктах с фиксированной шириной.Нет заголовков.В первом столбце указан идентификатор продукта, а его длина равна 7, как и мудрое имя продукта, которое также фиксируется примерно на 90 символов, начиная с позиции 8. Последний столбец - это кодовый номер, который составляет около 11 цифр.Если длина столбца мала или равна нулю, то он дополняется пробелом.

Пример записи: 1234567DAVIDOFF ............ 12345678912

Мне нужно найти конкретный код (последний столбец), если он найден, тополучить соответствующее название продукта из первого столбца.

Я начал с Apache LineIterator и прочитал каждую строку в ArrayList.После этого я хочу сохранить только идентификатор продукта и номер кода в памяти.Я знаю, как получить идентификатор продукта и кодовый номер, используя метод подстроки.

После этого я не знаю, какую структуру данных использовать для их хранения и как искать кодовый номер и получать соответствующий идентификатор продукта.,

Мне также интересно использовать Apache Commons или Guava для этого, если они просты. Есть хорошие предложения?

...