ошибка, которую вы получаете не в количестве сэмплов, а в количестве функций, и это происходит из строки кода:
cv = CountVectorizer(binary = True)
ct = CountVectorizer(binary= True)
cv.fit(feedback_data['data'].values)
ct.fit(feedback_data_test['data'].values)
Вам необходимо закодировать тест и обучитьтаким же образом
Вы устанавливаете Count Vectorizer на все данные, а затем применяете его к тестированию и обучению, если нет, то у вас нет одного и того же словаря и, следовательно, не одинакового кодирования.
cv = CountVectorizer(binary = True)
cv.fit(np.concatenate((feedback_data['data'].values,feedback_data_test['data'].values))
РЕДАКТИРОВАТЬ
вы просто не используете ct, только cv
X = feedback_data['data'].apply(lambda X : cv.transform([X])).values
X = list([list(x.toarray()[0]) for x in X])
X_test = feedback_data_test['data'].apply(lambda X_test :cv.transform([X_test])).values
X_test = list([list(x.toarray()[0]) for x in X_test])