У меня есть датафрейм для панд, df :
Search term Match type
second hand proace toyota crew cab sale Broad match
bmw m5 buy Exact match
Я бы хотел применить ngrams из пакета nltk к столбцу Критерий поиска .
Функция ngrams вернет кортеж.
Я бы хотел, чтобы в качестве конечного результата использовались только фразы, например:
Phrases
second hand
hand proace
proace toyota
toyota None
bmw m5
m5 buy
buy None
Вот что я понял до сих пор:
df['Phrases'] = df['Search term'].apply(lambda x: list(ngrams([x for x in x.split()], 2, pad_right=True)))
Это вывод из кода выше:
Search term Match type Phrases
second hand proace toyota Broad match [('second', 'hand'), ('hand', 'proace'), ('proace', 'toyota'), ('toyota', None)]
bmw m5 buy Broad match [('bmw', 'm5'), ('m5', 'buy'), ('buy', None)]
Как распаковать все кортежи в списке и распечатать их без запятой и скобок?