У меня есть функция:
def remove_stopwords(text):
return [[word for word in simple_preprocess(str(doc), min_len = 2) if word not in stop_words] for doc in texts]
Мой ввод - это список с токенизированным предложением:
input = ['This', 'is', 'an', 'example', 'of', 'my', 'input']
Предположим, что stop_words
содержит слова: 'this', 'is ',' an ',' of 'и' my ', то результат, который я хотел бы получить:
desired_output = ['example', 'input']
Тем не менее, фактический вывод, который я получаю сейчас:
actual_output = [[], [], [], ['example'], [], [], ['input']]
Как мне настроить свой код, чтобы получить этот вывод?