Я собираю полный HTML из службы, которая предоставляет доступ к очень большой коллекции блогов и новостных сайтов.Я проверяю HTML в реальном времени, чтобы увидеть, содержит ли он некоторые ключевые слова.Если он содержит одно из ключевых слов, я записываю HTML-код в текстовый файл для его хранения.
Я хочу сделать это в течение недели.Поэтому я собираю большое количество данных.Тестирование программы в течение 3 минут дало текстовый файл размером 100 МБ.У меня есть 4 ТБ свободного места, и я не могу использовать больше, чем это.
Кроме того, я не хочу, чтобы текстовые файлы становились слишком большими, потому что я предполагаю, что они станут не открываемыми.
Я предлагаю открыть текстовый файл и записать в него HTML, часто проверяя его размер.Если он становится больше, скажем, 200 МБ, я закрываю текстовый файл и открываю другой.Мне также нужно вести постоянный журнал того, сколько места я использовал в общей сложности, чтобы я мог убедиться, что я не приблизился к 4 ТБ.
Вопрос, который у меня есть на данный момент, таков:Как проверить размер текстового файла до его закрытия (с помощью FileWriter.close ()).Есть ли функция для этого или я должен подсчитать количество символов, записанных в файл и использовать его для оценки размера файла?
Отдельный вопрос: существуют ли способы минимизации количества места, занимаемого моими текстовыми файлами?Я работаю на Java.