В последнем Turi Create (6.0) отсутствует ближайшие_neighbor_deduplication? - PullRequest
0 голосов
/ 25 января 2020

Я использую turicreate 6.0 и ищу дедупликацию некоторых текстовых данных. Поиск этой функции дает эту документацию . Эта документация, по-видимому, не была обновлена ​​для turi, она все еще использует 'graphlab'.

Однако я не могу найти этот класс в turi create.

import turicreate as tc
books = tc.SFrame("blurbscleaned.csv")
tc.nearest_neighbor_deduplication.create(books, "Title", ["Title", "Author"])

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-44-2774685b1d3b> in <module>
----> 1 tc.nearest_neighbor_deduplication.create(books, "Title", ["Title", "Author"])

AttributeError: module 'turicreate' has no attribute 'nearest_neighbor_deduplication'

Версия:

tc.version_info.version

'6.0'

Есть ли другой способ дедупликации текстовых записей в тури? Мои дубликаты точные, поэтому мне, вероятно, не нужна статистическая дедупликация.

...