У меня есть набор данных, где каждый столбец имеет вероятность для различных параметров данного объекта. Первый столбец представляет собой строку, обозначающую имя объекта, в то время как все остальные столбцы имеют числовое значение c.
Я использую функцию cosine () из пакета 'coop', чтобы найти косинус сходство между объектами. В идеале я хочу, чтобы функция интерпретировала каждую строку как отдельный вектор и придавала мне индивидуальное косинусное сходство между каждым объектом. Как бы я ни старался, я не смог этого сделать, так как функция не принимает строковое значение (имя объекта) в качестве входных данных.
Для простоты, скажем, мои данные выглядят так (на самом деле это намного больше и сложнее):
ab c 0,75 0,23
xyz 0,80 0,40
jkl 0,32 0,91
Конечный результат, который мне нужен, будет матрица 3x3, которая сравнивает ab c, xyz и jkl с использованием числовых значений.
Я уверен, что мне здесь не хватает чего-то очень простого, но я был бы признателен за любую помощь. Есть ли способ, которым я могу сделать это?