При кластеризации с OpenRefine есть ли способ «исключить» строку в кластере? сейчас кажется, что он или все кластеризует или нет - PullRequest
1 голос
/ 23 апреля 2019

При использовании функции кластеризации в OpenRefine вы можете выбрать «Объединить?» возможность кластеризовать строки, которые были объединены с выбранным вами методом, но что, если метод правильно кластеризует большинство из них, за исключением одной строки, которую я определяю вручную, не относится к этому кластеру, есть ли способ исключить эту конкретную строку из остальная часть кластера?

1 Ответ

1 голос
/ 23 апреля 2019

К сожалению, в настоящее время нет способа исключить или выбрать подмножество терминов из кластера. Я могу придумать только два варианта:

  • а) измените алгоритм кластеризации, который вы используете, чтобы попытаться стать лучше кластеризация, которая не содержит неправильных терминов
  • б) Перейти к просмотру кластера »и пометьте строки с условиями, которые вы не хотите иметь в кластер (например, путем пометки строк), исключить помеченные строки в аспект и повторная кластеризация - тогда это не будет включать ни одно из условий ты не хотел
...