ValueError: Дублированное имя уровня: «rec_id», назначенный уровню 1, уже используется для уровня 0 - PullRequest
0 голосов
/ 01 июля 2018

Пока я реализовал этот пример кода на связывание записей Документация Python:

import recordlinkage
from recordlinkage.datasets import load_febrl4

dfA, dfB = load_febrl4()

# Indexation step
indexer = recordlinkage.BlockIndex(on='given_name')
pairs = indexer.index(dfA, dfB)

# Comparison step
compare_cl = recordlinkage.Compare()

compare_cl.exact('given_name', 'given_name', label='given_name')
compare_cl.string('surname', 'surname', method='jarowinkler', threshold=0.85, label='surname')
compare_cl.exact('date_of_birth', 'date_of_birth', label='date_of_birth')
compare_cl.exact('suburb', 'suburb', label='suburb')
compare_cl.exact('state', 'state', label='state')
compare_cl.string('address_1', 'address_1', threshold=0.85, label='address_1')

features = compare_cl.compute(pairs, dfA, dfB)

# Classification step
matches = features[features.sum(axis=1) > 3]
print(len(matches))

Я сталкиваюсь со следующей ошибкой:

Error: ValueError: Duplicated level name: "rec_id", assigned to level 1, is already used for level 0.

1 Ответ

0 голосов
/ 08 июля 2018

(в коде Eclipse или Visual Studio) Связывание записей Python - это алгоритм; следовательно, стоит реализовать при использовании Шаблон дизайна шаблона .

Кроме того, убедитесь, что python2 обновлен до установки требований в virtualenv :

Обновление python2

curl https://bootstrap.pypa.io/get-pip.py | python

После

pip install -r requirements.txt

При этом ValueError исчезает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...