сравнение записей в двух файлах для изменения данных - PullRequest
0 голосов
/ 16 марта 2012

У меня есть файлы с информацией о пользователе, которые я получаю каждый конец месяца.

Файл будет содержать столбцы, такие как идентификатор, имя, имя, адрес, телефон, автобусный телефон, хобби, книги.

идентификатор - это уникальный ключ для идентификации личности.

Мне нужно вести базу данных с информацией из этого файла.

Скажем, в январе у файла было 100 пользователей.В феврале файл имел 110 пользователей.Означает 10 новых пользователей.

Итак, я отсортирую оба файла по идентификатору, а теперь добавлю новых 10 пользователей и добавлю их.

Проблема в том, что я также хочу проверить изменения в существующих идентификаторах.

Таким образом, для идентификатора 3 в jan адрес был xyz, а в файле feb он стал pqr, я хочу узнать его и соответствующим образом обновить базу данных.

Итак - Самый простой и эффективныйспособ сравнить записи в двух файлах (фиксированный формат), чтобы узнать об изменении данных в столбцах?

Один из способов, о котором я мог подумать, - это наличие контрольной суммы для каждой записи в обоих файлах и сравнение их, чтобы узнать об изменениях.Но хотите знать, правильно ли это, или есть лучший подход?

Ответы [ 2 ]

0 голосов
/ 16 марта 2012

Легким и простым решением было бы добавить последний столбец обновлений и поставить там отметку даты / времени. По сути это будет то же самое, что и контрольная сумма, но будет удобочитаемым. Оба способа будут достаточно эффективны для определения размера базы данных.

0 голосов
/ 16 марта 2012

Ну, у вас есть метод FileUtils.contentEquals (http://commons.apache.org/io/apidocs/org/apache/commons/io/FileUtils.html). Это будет хорошо работать в тех случаях, когда нет основанных на времени заголовков и т. Д., А содержимое можно сравнивать напрямую

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...