Я пытаюсь использовать другой метод для очистки моих данных, но все они дают мне разные ошибки, сначала я пытаюсь заменить их, а затем делать что-то еще, но снова у меня возникают ошибки. Любая помощь, пожалуйста?
я пытаюсь сделать это str, это дает мне ошибку, не делая это str снова, это дает мне ошибку, я застрял!
Моя цель состоит в том, чтобы извлечь возраст Пациент из столбцов транскрипции: «там происходит седьмая ошибка», затем я пытаюсь очистить ее, но снова я не могу очистить данные.
fil = data['transcription']
fil.applymap(str) #First Error
fil.apply(str) #Second Error
re.sub('\W+', ' ', fil) #Third Error
fil.replace('-',' ') #Doesn't replace anything
data['transcription'] = data['transcription'].astype(str) #Fourth Error
for i in fil:
re.sub('-', ' ', i) #Fifth Error
i.replace('-',' ') #Sixth Error
re_list = [
'\d*\-year-old',
'\d*\ year old'
]
matches = []
for r in re_list:
matches += re.findall(r,i) #Seventh Error
print(matches)
Первая ошибка:
AttributeError: 'Series' object has no attribute 'applymap'
Вторая ошибка:
AttributeError: '17-year-old' is not a valid function for 'Series' object
Третья и пятая ошибка:
TypeError: expected string or bytes-like object
Четвертая ошибка:
ValueError: format number 1 of "b'17-year-old'" is not recognized
TypeError: data type '17-year-old' not understood
Шестая ошибка:
AttributeError: 'float' object has no attribute 'replace'
Седьмая Ошибка:
TypeError: expected string or bytes-like object