Гибка правил уникального столбца SQLITE - PullRequest
1 голос
/ 01 декабря 2010

Я работаю с большим количеством сторонних данных. Каждый набор данных имеет элементы с уникальными идентификаторами. Поэтому мне очень легко использовать уникальный столбец в SQLITE для обеспечения некоторой целостности данных.

Из тысяч записей у меня есть идентификатор из стороннего источника Соответствующие 2 уникальных идентификатора из стороннего источника B.

Есть ли способ изменить правила и разрешить дублирование записи в уникальном столбце? Если нет, то как я должен реорганизовать свои данные, чтобы позаботиться об этом единственном случае.

UPDATE:

CREATE TABLE "trainer" (
  "id" INTEGER PRIMARY KEY AUTOINCREMENT,
  "name" TEXT NOT NULL,
  "betfair_id" INTEGER NOT NULL UNIQUE,
  "racingpost_id" INTEGER NOT NULL UNIQUE
);

Данные о проблеме:

Мисс Беверли Дж. Томас http://www.racingpost.com/horses/trainer_home.sd?trainer_id=20514

Мисс Б J Томас http://www.racingpost.com/horses/trainer_home.sd?trainer_id=11096

против. Мисс Беверли Дж. Томас http://form.horseracing.betfair.com/form/trainer/1/00008861

Оба входа Racingpost (мой основной источник данных) соответствуют одной записи Betfair. Это единственная (пока) из тысяч записей.

1 Ответ

0 голосов
/ 01 декабря 2010

Если в гоночном посте должно быть только 1 совпадение, то это ошибка.

Если в гоночном посте разрешено иметь 2 совпадения на один идентификатор, у вас должно быть два идентификатора, выберите один или объедините данные.

Поскольку гоночный пост является вашим основным источником, иметь 2 идентификатора может иметь смысл. Однако, если вы хотите улучшить этот набор данных, объединяя эти данные или выбирая наиболее полезные, может быть более точным. Реальный вопрос заключается в том, сколько данных перекрывается между этими двумя записями и когда это возможно, вы можете их надежно обнаружить. Если перекрытие мало или у вас есть хорошее обнаружение состояния перекрытия, то объединение имеет больше смысла. Если перекрытие велико и вы не можете определить его достоверно, то более полезным будет выбрать последнее обновленное или имеющее два идентификатора.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...