У меня есть строки, которые имеют 2 символа табуляции как
# File contains multiple lines like this
'T1 Original 210 227 Extra Mile'
'T8 Modified 1646 1655 Tickets'
# Eg: "Tx" "indication" "start_index" "end_index" "word"
# 'T1\tOriginal 210 227\tExtra Mile'
Я хочу слово после второй вкладки. поэтому я пытаюсь найти индекс '\ t' и заменить исходную строку пустой.
def find_index(s, ch):
return [i for i, ltr in enumerate(s) if ltr == ch]
def extract_words(filename):
extracted_data = [line.rstrip('\n') for line in open(filename)]
search_key = '\t'
for i in range(len(extracted_data)):
indices = find_index(extracted_data[i], search_key)
extracted_data[i] = extracted_data[i].replace(extracted_data[i][:indices[-1]], '')
return extracted_data
но он не идентифицирует '\ t', поскольку индекс выводится как [].
в чем причина проблемы?
ожидаемый результат
'Extra Mile'
'Tickets'