Панды загружают фрейм данных из MSSQL - PullRequest
0 голосов
/ 01 мая 2018

Я пытаюсь загрузить данные в фрейм данных, чтобы потом использовать их в записи, однако я получаю сообщение об ошибке:

Пустой DataFrame Столбцы: [Имя, Фамилия, Имя компании] Индекс: []

А я не уверен, что делаю не так?

Код:

import pymssql
import time

import recordlinkage
import pandas.io.sql as psql



#SQL connection
conn = pymssql.connect(host='server', user='xx', password='xx', database='Test')
cursor = conn.cursor()


print(time.ctime())


sql = "select FirstName, LastName, CompanyName, ID from [Test].[dbo].[Person]with(nolock) where ID < 100"





dfA = psql.read_sql(sql, conn,  index_col='ID')
print(dfA)

# Indexation step

pcl = recordlinkage.index.Block(on='FirstName')
pairs = pcl.index(dfA)

# Comparison step
compare_cl = recordlinkage.Compare()

compare_cl.exact('FirstName', 'FirstName', label='FirstName')
compare_cl.string('LastName', 'LastName', method='jarowinkler', threshold=0.85, label='LastName')
compare_cl.string('CompanyName', 'CompanyName', threshold=0.85, label='CompanyName')

features = compare_cl.compute(pairs, dfA)

# Classification step
matches = features[features.sum(axis=1) > 3]

print(len(matches))

print(matches)

1 Ответ

0 голосов
/ 02 мая 2018

Эта часть возвращала ошибку, что в DataFrame нет данных исправить это изменение> 3 на> 2 или> 1

matches = features[features.sum(axis=1) > 3]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...