SSIS Term Extraction для неанглийского текста - PullRequest
1 голос
/ 10 марта 2011

Я начал изучать интеллектуальный анализ данных с использованием SQL Server, и мне было любопытно, что службы интеграции SQL Server способны выполнять извлечение терминов из текста на английском языке.Однако мне интересно выполнять Text Mining из неанглийского текста, в основном из украинского.Итак, вот те самые вопросы:

  1. Есть ли способ реализовать извлечение терминов из неанглийского текста в SSIS?Если да, то любые подходящие ресурсы приветствуются:)
  2. Если ответ на первый вопрос положительный, я хотел бы знать, есть ли уже некоторые нестандартные решения для неанглийского текста.

Заранее спасибо:)

1 Ответ

0 голосов
/ 16 марта 2011

Документация гласит , что преобразование извлечения термина поддерживает только английский, и нет никакого упоминания о механизме добавления других языков.

Поэтому я бы предположил, что вам нужно найти какой-то инструмент, который может выполнять извлечение терминов из украинского текста, и решить, как интегрировать его в SSIS. Поиск такого инструмента на самом деле не проблема SSIS, это общий вопрос NLP или лингвистика, так что вы можете получить лучший ответ на другом форуме.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...