Вам необходимо загрузить оба файла и для каждого файла и сохранить текстовые данные (xTrain, xTest) и метки (yTrain, yTest) по отдельности.
Поскольку вы работаете с файлами .csv, вы можете загружать это примерно так:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
# Load .csv files
csvfilename_train = 'TrainData.csv'
csvfilename_test = 'TestData.csv'
# Read .csv files as pandas dataframes
df_train = pd.read_csv(csvfilename_train)
df_test = pd.read_csv(csvfilename_test)
# Initialize TfidfVectorizer to create your TF-IDF matrix
vectorizer = TfidfVectorizer()
# Extract text data from dataframes
train_corpus = df_train['text_column'].values
test_corpus = df_test['text_column'].values
# Extract labels from dataframes
yTrain= df_train['label_column'].values
yTest= df_test['label_column'].values
# Fit TF-IDF vectorizer to train data and transform train_corpus
xTrain = vectorizer.fit_transform(train_corpus)
# Transform test_corpus to matrix
xTest = vectorizer.transform(test_corpus)
Итак, теперь у вас есть xTrain, xTest, yTrain, yTest.
И, пожалуйста, в следующий раз попробуйте добавить минимальный пример в качестве рабочего кода, чтобы вашу проблему можно воспроизвести и проанализировать.