Я использую turicreate 6.0 и ищу дедупликацию некоторых текстовых данных. Поиск этой функции дает эту документацию . Эта документация, по-видимому, не была обновлена для turi, она все еще использует 'graphlab'.
Однако я не могу найти этот класс в turi create.
import turicreate as tc
books = tc.SFrame("blurbscleaned.csv")
tc.nearest_neighbor_deduplication.create(books, "Title", ["Title", "Author"])
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-44-2774685b1d3b> in <module>
----> 1 tc.nearest_neighbor_deduplication.create(books, "Title", ["Title", "Author"])
AttributeError: module 'turicreate' has no attribute 'nearest_neighbor_deduplication'
Версия:
tc.version_info.version
'6.0'
Есть ли другой способ дедупликации текстовых записей в тури? Мои дубликаты точные, поэтому мне, вероятно, не нужна статистическая дедупликация.