Нужна помощь, чтобы извлечь имя человека - PullRequest
0 голосов
/ 02 мая 2019

Я извлекаю данные с веб-сайта и хочу получить имена студентов в правильной форме.

Как я могу изменить \xa0 RAJAT KUMAR\r\n ' на RAJAT KUMAR.

1 Ответ

0 голосов
/ 02 мая 2019

Вы можете использовать strip (), которая поможет вам в этом.

string = '\xa0  RAJAT KUMAR\r\n                                '
print(string.strip())
# RAJAT KUMAR

Если не получится, попробуйте использовать эту функцию, это будет полезно.

def RemoveMeta(string):
    import re
    string = re.sub('\s+',' ',string)
    string = re.sub('\n|\t|^\s+\|\s+$','',string)
    string = string.strip()
    return string
print(RemoveMeta(string))
# RAJAT KUMAR

Также, если у вас есть какие-либо проблемы с кодировкой или текстом, которые вы можете включить ниже, которые помогут вам,

import ftfy
string = ftfy.fix_text(string)
...