Question

У меня есть файл в формате ASCII с 250k + строками текста, над которыми мне нужно выполнить 2 шага.

1) просканировать весь файл и выделить разделы, сопоставляя заданный шаблон регулярного выражения.

2) читать каждый раздел данных и разбирать из него подразделы.

Одним из вариантов является использование строчного сканирования файла с использованием BufferedReader, проверка каждой строки на совпадение и сохранение номера строки на совпадения.

Существуют ли более эффективные варианты использования пространства имен nio?

Adrian · Answer 1 · 05 октября 2010

Возможно прокачать файл через цепочку потоков; один поток, который пропускает только разделы, соответствующие вашему регулярному выражению, за которым следует поток, выполняющий этап синтаксического анализа.

, например

OutputStream os = RegexFilterOutputStream(
                  new ParsingStuffOutputStream()
                  );
while(input not empty) {
    // write stuff from input to os
}

Выделение и извлечение данных из больших текстовых файлов с использованием Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Выделение и извлечение данных из больших текстовых файлов с использованием Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов