У меня большой текстовый файл (2 ГБ). Я прочитал весь текстовый файл символ за символом, чтобы узнать частоту каждого символа во всем текстовом файле, используя следующий фрагмент кода.
BufferedReader reader = new BufferedReader(
new InputStreamReader(
new FileInputStream(file),
Charset.forName("UTF-8")));
int c;
while ((c = reader.read()) != -1) {
char ch = (char) c;
// rest of the code
}
Теперь мне нужно сгенерировать матрицу с частотой последовательных символов.
Например, сколько раз символ «b» существует после символа «a» (последовательный, прямой символ) и наоборот.
Предположим, у меня есть строка ввода (из файла): cad bed abed dada
частотная матрица, будет как
Пожалуйста, нажмите здесь, чтобы увидеть изображение
Как это сделать? Буду признателен за любую помощь и предложение.
Спасибо.