Я пытаюсь получить значение src из документа XML, и в одном, с которым я его тестирую, src:
<content src="content/Orwell - 1984 - 0451524934_split_2.html#calibre_chapter_2"/>
Это создает проблему при попытке открыть файл. Я не уверен, как называется этот суффикс # (материал), поэтому мне не повезло в поисках ответа. Я просто хотел бы простой способ удалить его, если это возможно. Я полагаю, что мог бы написать функцию для поиска # и удаления чего-либо после этого, но это сломало бы, если бы имя файла содержало символ # (или файл мог даже иметь этот символ?)
Спасибо!