Как разделить многострочную строку на несколько строк? - PullRequest
248 голосов
/ 05 октября 2008

У меня есть многострочный строковый литерал, который я хочу сделать для каждой строки, например:

inputString = """Line 1
Line 2
Line 3"""

Я хочу сделать что-то вроде следующего:

for line in inputString:
    doStuff()

Ответы [ 6 ]

371 голосов
/ 05 октября 2008
inputString.splitlines()

Предоставит вам список с каждым элементом, метод splitlines() предназначен для разделения каждой строки на элемент списка.

196 голосов
/ 05 октября 2008

Как и другие говорили:

inputString.split('\n')  # --> ['Line 1', 'Line 2', 'Line 3']

Это идентично приведенному выше, но функции строкового модуля устарели и их следует избегать:

import string
string.split(inputString, '\n')  # --> ['Line 1', 'Line 2', 'Line 3']

В качестве альтернативы, если вы хотите, чтобы каждая строка включала последовательность разрыва (CR, LF, CRLF), используйте метод splitlines с аргументом True:

inputString.splitlines(True)  # --> ['Line 1\n', 'Line 2\n', 'Line 3']
45 голосов
/ 06 марта 2014

Использование str.splitlines().

splitlines() правильно обрабатывает переводы строк, в отличие от split("\n").

Он также имеет преимущество, упомянутое @efotinis, заключающееся в необязательном включении символа новой строки в результат разделения при вызове с аргументом True.


Подробное объяснение того, почему вы не должны использовать split("\n"):

\n в Python представляет разрыв строки Unix (десятичный код ASCII 10) независимо от платформы, на которой вы его запускаете. Однако представление переноса строки зависит от платформы . В Windows \n - это два символа, CR и LF (десятичные коды ASCII 13 и 10, AKA \r и \n), в то время как в любом современном Unix (включая OS X) это один символ LF.

print, например, работает правильно, даже если у вас есть строка с окончаниями строки, которые не соответствуют вашей платформе:

>>> print " a \n b \r\n c "
 a 
 b 
 c

Однако явное разбиение на «\ n» приведет к зависимому от платформы поведению:

>>> " a \n b \r\n c ".split("\n")
[' a ', ' b \r', ' c ']

Даже если вы используете os.linesep, оно будет разделяться только в соответствии с разделителем новой строки на вашей платформе и завершится ошибкой, если вы обрабатываете текст, созданный на других платформах, или с использованием \n:

>>> " a \n b \r\n c ".split(os.linesep)
[' a \n b ', ' c ']

splitlines решает все эти проблемы:

>>> " a \n b \r\n c ".splitlines()
[' a ', ' b ', ' c ']

Чтение файлов в текстовом режиме частично смягчает проблему представления новой строки, поскольку она преобразует Python \n в представление новой строки платформы. Однако текстовый режим существует только в Windows. В системах Unix все файлы открываются в двоичном режиме, поэтому использование split('\n') в системе UNIX с файлом Windows приведет к нежелательному поведению. Кроме того, нет ничего необычного в том, чтобы обрабатывать строки с потенциально новыми символами новой строки из других источников, например из сокета.

19 голосов
/ 25 мая 2013

В данном случае может быть излишним, но другой вариант предполагает использование StringIO для создания файлового объекта

for line in StringIO.StringIO(inputString):
    doStuff()
1 голос
/ 11 сентября 2018

Исходное сообщение, запрошенное для кода, который печатает несколько строк (если они верны для некоторого условия) плюс следующую строку. Моя реализация будет такой:

text = """1 sfasdf
asdfasdf
2 sfasdf
asdfgadfg
1 asfasdf
sdfasdgf
"""

text = text.splitlines()
rows_to_print = {}

for line in range(len(text)):
    if text[line][0] == '1':
        rows_to_print = rows_to_print | {line, line + 1}

rows_to_print = sorted(list(rows_to_print))

for i in rows_to_print:
    print(text[i])
1 голос
/ 16 июня 2015

Хотелось бы, чтобы в комментариях было правильное форматирование текста кода, потому что я думаю, что ответ @ 1_CR нуждается в большем количестве ошибок, и я хотел бы дополнить его ответ. Во всяком случае, он привел меня к следующей технике; он будет использовать cStringIO, если он доступен (НО ПРИМЕЧАНИЕ: cStringIO и StringIO не совпадают , потому что вы не можете создать подкласс cStringIO ... это встроенный ... но для основных операций синтаксис будет идентичен , так что вы можете сделать это):

try:
    import cStringIO
    StringIO = cStringIO
except ImportError:
    import StringIO

for line in StringIO.StringIO(variable_with_multiline_string):
    pass
print line.strip()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...