У меня есть список слов (если они должны храниться в String []). Я хочу отфильтровать слова, которые относятся к широкой общей категории, такие как Музыка или Спорт .
Есть ли готовое решение для этого (даже если это только для ограниченного набора общих категорий)?
Или как бы вы поступили так?
Это должно быть сделано в Java 1.6 , и это проблема НЛП (обработки естественного языка). Во входном списке слов есть случайные слова, и я хочу извлечь из этого большого списка только слова, которые относятся к данной общей категории (которая будет подмножеством).
Другой способ мышления: Учитывая одно слово, я хочу определить, принадлежит ли это слово к категории. Примерно так:
String word1 = "football"; //the strings will always be single word units
String word2 = "telephone";
boolean b1 = belongsToCategory(Categories.SPORTS, word1); //true
boolean b2 = belongsToCategory(Categories.SPORTS, word2); //false
Если вам нужна дополнительная информация, пожалуйста, спросите.