Итак, я работал над этим проектом чата, я использую SVM для его ML и очень хочу использовать...
У меня есть два разных текста, которые я хочу сравнить, используя векторизацию tfidf.То, что я...
Я удаляю дубликаты из ввода больших строк, я создал матрицу сходства косинусов, как показано ниже....
У меня есть массив: [[ 0.32730174 -0.1436172 -0.3355202 -0.2982458 ] [ 0.50490916 -0.33826587 0
Я работаю над фреймом данных, который содержит данные по номеру документа строки и только текст.Эти...
Вот мои векторы: lin_acc_mag_mean vel_ang_unc_mag_mean <dbl> <dbl> 1 0.688 0.317...
Я работаю над ошибками. Набор данных XML: `</short_desc> <report id="322231">...
Я использую Gensim LDA для моделирования тем, чтобы найти темы для каждого документа и проверить...
Я хотел бы спросить вас, может ли кто-нибудь проверить мой код, потому что он ведет себя странно -...
я хочу получить косинусное сходство между предложениями. Я протестировал doc2vec с помощью gensim и...
Я хочу измерить сходство между предложениями. Могу ли я использовать sklearn и евклидово расстояние...
Так что я борюсь за концепцию поиска информации.Это касается косинусного сходства документов,...
У меня есть два вектора разных размеров, имеющих разные значения. v1=c("3423"...
Допустим, у меня есть такая матрица: [[5.05537647 4.96643654 4.88792309 4.48089566 4.4469417 3
У меня большой набор данных, и мне необходимо вычислить косинус-сходства между продуктами в...
Мой вариант использования - векторизация слов в двух списках, как показано ниже. ListA = [Japan,...
У меня есть два списка, содержащие имена клиентов. Имена могут быть похожими или разными. Как найти...
У меня есть два списка слов, как показано ниже List1 = [яблоко, Samsung, Nokia, LG, Micromax] List2...
У меня есть два вектора, каждый для for [(x1, y1), (x2, y2), ...]. «x_vals» и «y_vals» содержат...
Я хочу преобразовать Spark DataFrame в CoordinateMatrix, а затем RowMatrix, чтобы впоследствии...
Здравствуйте, пользователи Stackoverflow, В настоящее время я борюсь с решением этой проблемы: У...
Мой ввод - это строка в этом (spintax) формате, "The {PC|Personal Computer|Desktop} is in...
В основном, учитывая некоторый вектор v, я хочу получить другой случайный вектор w с некоторым...
Я тестирую реализацию алгоритма Роккио. Начальные результаты в порядке.Но когда я отмечаю документ...
Формат данных CSV Общее количество документов 500. Количество полей 10. просмотр данных я...