Имеет ли смысл сравнивать или сопоставлять два разных длины текста tf_idf.
При анализе контента мы обычно кодируем текст и считаем. А потом проведите корреляционный анализ, чтобы понять сходство содержания.
Я хочу сделать анализ контента, используя tf_idf. Как вы думаете, это будет работать?
İnanç