Rosoka - это коммерческий продукт, который обеспечивает вычисление «значимости», которое измеряет важность термина или сущности для документа.Значимость основана на языковом использовании, а не на частоте.Используя значения значимости, вы можете определить основную тему документа в целом.В результате вы выбираете XML или JSON, что делает его очень простым в использовании с Lucene.Это написано на Java.Доступна версия Amazon Cloud по адресу https://aws.amazon.com/marketplace/pp/B00E6FGJZ0.. Стоимость пробной версии составляет $ 0,99 / час.Версия Rosoka Cloud не имеет всех функций Java API, доступных для полной версии Rosoka.Да, обе версии выполняют устранение неоднозначности сущности и термина на основе лингвистического использования.
Устранение неоднозначности, будь то человек или программное обеспечение, требует достаточного количества контекстной информации, чтобы определить разницу.Контекст может содержаться в документе, в ограничении корпуса или в контексте пользователей.Первый более конкретен, а второй имеет большую потенциальную неопределенность.Т.е. ввод ключевого слова «калитка» в поиске Google может относиться либо к крикету, либо к программному обеспечению Apache, либо к персонажу Star Wars Ewok (т.е. к сущности).Общее Предложение «Калитка охраняется игроком с битой» содержит контекстные подсказки внутри предложения, чтобы интерпретировать его как объект.«Уикет Уистри Уоррик был разведчиком эвок» должен вводить слово «Уикет» как имя лица «Уикет Уистри Уоррик».«Добро пожаловать в Apache Wicket» содержит контекстную информацию о том, что «Wicket» является частью названия места и т. Д.