объединение неповторяющихся строк в одну строку - python - PullRequest
0 голосов
/ 07 июня 2018

Я ищу несколько советов для небольших, но сбивающих с толку данных:

P2  Chain   161771  642 ID=0000025456
P2  Chain   161771  642 ID=0000438090
P2  Chain   161771  642 ID=0000438071
P2  Chain   161771  642 ID=00438072
P2  Chain   161771  642 ID=011423689
P2  Chain   161771  642 ID=002655525

В этих данных в последнем столбце присутствуют только неповторяющиеся значения.Я хочу упростить эти данные с помощью скрипта / функции, чтобы объединить эти значения в одной строке следующим образом:

P2  Chain   161771  642 ID=0000025456, 0000438071,0000438090, 002655525, 011423689, 00438072

1 Ответ

0 голосов
/ 07 июня 2018
text = ''' P2  Chain   161771  642 ID=0000025456
P2  Chain   161771  642 ID=0000438090
P2  Chain   161771  642 ID=0000438071
P2  Chain   161771  642 ID=00438072
P2  Chain   161771  642 ID=011423689
P2  Chain   161771  642 ID=002655525'''

ids = [] # We will store the ids here
for line in text.splitlines(): # break the text block into lines and iterate over them
    split_line = line.split('=') # break the line into two pieces, before and after the '='
    id = split_line[1] # set id to be the part after '=', ie: the ID
    ids.append(id)

print ('P2 Chain 161771 642 ID=' + str(ids)) 

Выход:

P2 Chain 161771 642 ID=['0000025456', '0000438090', '0000438071', '00438072', '011423689', '002655525']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...