У меня есть следующие предложения:
sentences<-c("The color blue neutralizes orange yellow reflections.",
"Zod stabbed me with blue Kryptonite.",
"Because blue is your favourite colour.",
"Red is wrong, blue is right.",
"You and I are going to yellowstone.",
"Van Gogh looked for some yellow at sunset.",
"You ruined my beautiful green dress.",
"There's nothing wrong with green.")
, которые я хотел бы классифицировать по следующим классам:
A<-c("red")
B<-c("orange")
C<-c("yellow","yellowstone")
D<-c("blue")
E<-c("green")
Сложность этой задачи заключается в том, что первое предложение, например , можно классифицировать в D
, B
, C
, тогда результирующая классификация должна быть B+C+D
. Второе и третье предложения просто D
. Четвертое предложение - A
и D
, а затем A+D
. Пятое предложение - C
и т. Д.