Какой лучший алгоритм для сравнения двух больших наборов данных с небольшими различиями? - PullRequest
0 голосов
/ 11 апреля 2020

У меня получен набор данных с веб-сайта, и я пытаюсь сделать обновление один раз в час. Каждые данные представляют собой одну строку длиной около 5-20 символов.

Этот веб-сайт отвечает только json, который содержит полный набор данных (очень большой и не имеет отметки времени, отсортированные в алфавитном порядке). Но в то же время, он имеет только один или два новых данных в день.

Я сравниваю их с полным l oop, что, похоже, является пустой тратой вычислений.

Есть ли какой-нибудь алгоритм, подходящий для такой ситуации?

...