Я немного запутался в концепции tf-idf.
В обучающих данных мы используем fit_transform , чтобы создать словарь данных и превратить данные в вектор весов
и когда мы хотим провести тестирование данных, мы используем transform , чтобы превратить тест данных в вектор весов.мы используем функцию transform , потому что у нас уже есть словарь и хотим превратить тест данных в вектор весов, основанный на последовательности данных словаря, верно?
мои вопросы: когда мы используем преобразовать в тест данных, вес цепочки данных тоже меняется или нет?или TfidfVectorizer подсчитывает перерасход веса с помощью набора данных + тест данных, чтобы получить новый вес?или TfidfVectorizer просто посчитает вес теста данных только на основе данных поезда, не используя вес данных для получения веса?
Я искал эту проблему, но какой-то источник не дал мне полного объяснения по этому поводу.надеюсь, вы, ребята, можете помочь мне ответить на это.Большое спасибо от меня.