Я читаю xml-файл, содержащий строки типа:
<PLAYER_NAME>Andrew Tell</PLAYER_NAME>
Я хочу извлечь все имена из файла, и я попытался:
name = (line.strip()
.lstrip('<PLAYER_NAME>')
.rstrip('</PLAYER_NAME>'))
и
name = line.strip()
name = name.lstrip('<PLAYER_NAME>')
name = name.rstrip('</PLAYER_NAME>')
Они работают для некоторых имен, но если имя начинается с любого из: A, E, L, M, N, R, Y (и, возможно, некоторых других), то этот символ также удаляется.так что в приведенном выше примере я получаю 'Andrew Tell', но Уильям Телль в порядке.Я не проверял полный алфавит, но я знаю, что имена, начинающиеся с любого из: B, C, D, H, I, J, S, T, W, все извлечены правильно
Мне пришлосьприбегнуть к уродливому:
namebits = line.split('>',1)
name = namebits[-1].split('<')[0]
Кажется, это работает для всех имен.
У меня известная проблема с s.lstrip или я что-то не так делаю?