C ++ Обработка данных в табличной форме - PullRequest
0 голосов
/ 21 июня 2020

Вероятно, это моя ошибка, но я не могу найти решение своей проблемы.

У меня есть база данных ( dataset.txt ) со следующей структурой: темы (несколько файлов для каждой темы и несколько текстовых файлов, Summary.txt, по одному для каждой темы) → каждая тема включает разные сеансы ( Сессия ) → каждый сеанс включает одну или несколько записей ( Запись ) → каждая запись включает определенное количество последовательностей стимулов ( Количество последовательностей ).

Количество последовательностей может быть указано либо в строке, следующей за указанием Сессия или на линии, следующей за указанием Записи. В первом случае все Записи сеанса будут иметь одно и то же значение, указанное для всего сеанса. Наконец, для каждой записи должны быть извлечены две информации: Character1 и Character2, которые соответственно представляют правильные символы и символы, распознаваемые определенными параметрами (объяснение которых здесь не актуально).

Я хотел бы создать машину функция обучения таким образом, что во время первого сеанса система не будет выполнять распознавание символов, поскольку система должна «научиться» распознавать параметр и, следовательно, еще не обученная, она не может ничего распознать. Однако информация, содержащаяся в текстовом файле базы данных (dataset.txt), должна быть представлена ​​в табличной форме, чтобы с ней было легче работать. Я пытаюсь найти способ написать программу на C ++, которая может считывать информацию из файла dataset.txt и может генерировать другую в табличной форме, как показано в следующем примере:

Session Recording Number of sequences Character1 Character2 1 1 1 5 Grains

Выходной файл (output.txt), следовательно, должен иметь одну строку для любой записи файла dataset.txt

Session 1 (COPY MODE): 
Number of sequences: 15 
Recording 1: Character1 : Wheat
Recording 2: Character1 : Meat
Recording 3: Character1 : Water


Session 2 (COPY MODE): 
Classification matrix: 
1       25      1     -0.73845 
1       11      1      0.47000 
1       22      1      0.75111 
1       44      1     -0.22278 
1       66      1     -0.32277 

Recording 1: 
Number of sequences: 15 
Character 1: Cinnamon 
Character 2: Peppermint

выходной файл должен быть:

 1    1      15 Wheat 
 1    2      15 Meat 
 1    3      15 Water 

2 1 15 Cinnamon Peppermint

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...