Векторизация TF-IDF работает с необработанным (то есть, не токенизированным) текстом и выполняет токенизацию самостоятельно.
Для метода fit_transform
требуется итерация строк. Применение токенайзера NLTK превращает строки рецензирования в список строк (список токенов).
Если по какой-то причине вы не доверяете внутреннему токенизатору в scikit-learn, вы можете использовать собственный токенизатор:
tfidf = TfidfVectorizer(tokenizer=nltk.word_tokenize)