Это CSV-файл для анализа в нашей программе. Это один из многих файлов CSV
ID | TITLE | COMPANY | DATE | REV | VIEW_TIME
id1 | title1 | company 1 | 2014-04-01 | 4.00 | 1: 30
id1 | title3 | company 2 | 2014-04-03 | 6.00 | 2: 05
id2 | title4 | company 1 | 2014-04-02 | 8.00 | 2: 45
id3 | title2 | company 1 | 2014-04-02 | 4.00 | 1: 05
Улов, как указано в задании, следующий:
Ваша первая задача - проанализировать и импортировать файл в простое хранилище данных. Вы можете использовать любой формат файла, который вы хотите использовать для хранения данных. Для этого назначения вы должны написать свое собственное хранилище данных, а не использовать существующее, такое как база данных SQL. Кроме того, вы должны предположить, что после импорта многих файлов хранилище данных будет слишком большим, чтобы поместиться в памяти. Записи в хранилище данных должны быть уникальными по идентификатору, названию и дате. Последующий импорт с той же логической записью должен перезаписать более ранние записи.
Поскольку структура данных не может хранить все данные в памяти, мне нужно искать более постоянное решение для хранения. Запись в файл кажется более подходящей, чем любое другое решение, но здесь кроется подвох. Если мне нужно перезаписать содержимое на основе ID, TITLE и DATE, то мне придется загрузить весь контент в память, прежде чем перезаписать его, что невозможно, согласно предварительному условию.
ЧТО Я ИЩУ
Какой подход мне выбрать? Я не ищу пример кода, но я надеюсь, что у некоторых есть представление о том, какую структуру данных или структуру файлов использовать. Любые предложения, такие как Use a stack or a list or a file structure is appreciated
.