Python: как разбить строку по недопустимому разделителю <0x0c> - PullRequest
0 голосов
/ 15 января 2019

У меня есть документ, который содержит фрахтователя <0x0c>. Использование re.split.
Проблема в том, что это выглядит так:

import re
re.split('',text) 

Когда это работает, вы НЕ МОЖЕТЕ увидеть фрахтователя и, если не считать приятного комментария, это отличный кандидат на то, чтобы стать одним из тех устаревших кодов, которые мог понять только я.

Как я могу написать это другим, читаемым способом?

1 Ответ

0 голосов
/ 15 января 2019

Вы можете выразить любой символ, используя escape-коды. Кодовая точка 0x0C подачи кода ASCII может быть выражена как \f или как \x0c:

re.split('\f', text)

См. Синтаксис строки и байтовых литералов Python для получения дополнительной информации о том, какие escape-последовательности поддерживает Python при определении значения строкового литерала.

Примечание: вам не нужно использовать модуль регулярных выражений для разделения последовательностей символов по прямой линии, вы также можете использовать str.split() здесь:

text.split('\f')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...