Как удалить идентификаторы журнала из описания данных журнала в Pandas / Python - PullRequest
0 голосов
/ 30 ноября 2018

У меня есть данные журнала в виде кадра данных pandas.Один столбец представляет собой текстовое описание (строки), которое содержит идентификаторы журналов в виде «blk_-NUMBER».Одно из текстовых описаний выглядит так:

'Blocked NameSystem.addStoredBlock: blockMap updated: 10.250.10.223:50010 is added to blk_-3435353464324 size 34535434'

Я просто хочу удалить «blk_-NUMBER» из этого столбца и оставить все остальное там, например:

'Blocked NameSystem.addStoredBlock: blockMap updated: 10.250.10.223:50010 is added to size 34535434'

Обратите внимание, что в «blk_-NUMBER» «NUMBER» может иметь переменную длину.

1 Ответ

0 голосов
/ 30 ноября 2018

Вы можете использовать регулярное выражение с библиотекой re следующим образом:

import re
s = 'Blocked NameSystem.addStoredBlock: blockMap updated: 10.250.10.223:50010 is added to blk_-3435353464324 size 34535434'
result = re.sub(' blk_-[0-9]*','',s)
print result
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...