Question

Мне нужно заменить некоторые символы следующим образом: & -> \&, # -> \#, ...

Я закодировал это следующим образом, но я думаю, что должен быть какой-то лучший способ. Есть намеки?

strs = strs.replace('&', '\&')
strs = strs.replace('#', '\#')
...

Hugo · Answer 1 · 23 ноября 2014

Замена двух символов

Я рассчитал все методы в текущих ответах вместе с одним дополнительным.

С входной строкой abc&def#ghi и заменой & -> \ & и # -> #, быстрее всего было объединить замены, например: text.replace('&', '\&').replace('#', '\#').

Времена для каждой функции:

a) 1000000 циклов, лучшее из 3: 1,47 мкс на цикл
b) 1000000 петель, лучшее из 3: 1,51 мкс на петлю
c) 100000 петель, лучшее из 3: 12,3 мкс на петлю
d) 100000 петель, лучшее3: 12 мкс на цикл
e) 100000 циклов, лучшее из 3: 3,27 мкс на цикл
f) 1000000 циклов, лучшее 3: 0,817 мкс на цикл
г) 100000 петель, лучшее из 3: 3,64 мкс на петлю
ч) 1000000 петель, лучшее из 3: 0,927 мкс на петлю
i) 1000000 циклов, лучшее из 3: 0,814 мкс на цикл

Вот функции:

def a(text):
    chars = "&#"
    for c in chars:
        text = text.replace(c, "\\" + c)


def b(text):
    for ch in ['&','#']:
        if ch in text:
            text = text.replace(ch,"\\"+ch)


import re
def c(text):
    rx = re.compile('([&#])')
    text = rx.sub(r'\\\1', text)


RX = re.compile('([&#])')
def d(text):
    text = RX.sub(r'\\\1', text)


def mk_esc(esc_chars):
    return lambda s: ''.join(['\\' + c if c in esc_chars else c for c in s])
esc = mk_esc('&#')
def e(text):
    esc(text)


def f(text):
    text = text.replace('&', '\&').replace('#', '\#')


def g(text):
    replacements = {"&": "\&", "#": "\#"}
    text = "".join([replacements.get(c, c) for c in text])


def h(text):
    text = text.replace('&', r'\&')
    text = text.replace('#', r'\#')


def i(text):
    text = text.replace('&', r'\&').replace('#', r'\#')

По таймеру:

python -mtimeit -s"import time_functions" "time_functions.a('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.b('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.c('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.d('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.e('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.f('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.g('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.h('abc&def#ghi')"
python -mtimeit -s"import time_functions" "time_functions.i('abc&def#ghi')"

Замена 17 символов

Вот аналогичный код, чтобы сделать то же самое, но с большим количеством символов для выхода (\ `* _ {}> # + -.! $):

def a(text):
    chars = "\\`*_{}[]()>#+-.!$"
    for c in chars:
        text = text.replace(c, "\\" + c)


def b(text):
    for ch in ['\\','`','*','_','{','}','[',']','(',')','>','#','+','-','.','!','$','\'']:
        if ch in text:
            text = text.replace(ch,"\\"+ch)


import re
def c(text):
    rx = re.compile('([&#])')
    text = rx.sub(r'\\\1', text)


RX = re.compile('([\\`*_{}[]()>#+-.!$])')
def d(text):
    text = RX.sub(r'\\\1', text)


def mk_esc(esc_chars):
    return lambda s: ''.join(['\\' + c if c in esc_chars else c for c in s])
esc = mk_esc('\\`*_{}[]()>#+-.!$')
def e(text):
    esc(text)


def f(text):
    text = text.replace('\\', '\\\\').replace('`', '\`').replace('*', '\*').replace('_', '\_').replace('{', '\{').replace('}', '\}').replace('[', '\[').replace(']', '\]').replace('(', '\(').replace(')', '\)').replace('>', '\>').replace('#', '\#').replace('+', '\+').replace('-', '\-').replace('.', '\.').replace('!', '\!').replace('$', '\$')


def g(text):
    replacements = {
        "\\": "\\\\",
        "`": "\`",
        "*": "\*",
        "_": "\_",
        "{": "\{",
        "}": "\}",
        "[": "\[",
        "]": "\]",
        "(": "\(",
        ")": "\)",
        ">": "\>",
        "#": "\#",
        "+": "\+",
        "-": "\-",
        ".": "\.",
        "!": "\!",
        "$": "\$",
    }
    text = "".join([replacements.get(c, c) for c in text])


def h(text):
    text = text.replace('\\', r'\\')
    text = text.replace('`', r'\`')
    text = text.replace('*', r'\*')
    text = text.replace('_', r'\_')
    text = text.replace('{', r'\{')
    text = text.replace('}', r'\}')
    text = text.replace('[', r'\[')
    text = text.replace(']', r'\]')
    text = text.replace('(', r'\(')
    text = text.replace(')', r'\)')
    text = text.replace('>', r'\>')
    text = text.replace('#', r'\#')
    text = text.replace('+', r'\+')
    text = text.replace('-', r'\-')
    text = text.replace('.', r'\.')
    text = text.replace('!', r'\!')
    text = text.replace('$', r'\$')


def i(text):
    text = text.replace('\\', r'\\').replace('`', r'\`').replace('*', r'\*').replace('_', r'\_').replace('{', r'\{').replace('}', r'\}').replace('[', r'\[').replace(']', r'\]').replace('(', r'\(').replace(')', r'\)').replace('>', r'\>').replace('#', r'\#').replace('+', r'\+').replace('-', r'\-').replace('.', r'\.').replace('!', r'\!').replace('$', r'\$')

Вот результаты для той же входной строки abc&def#ghi:

a) 100000 петель, лучшее из 3: 6,72 мкс на петлю
b) 100000 петель, лучшее из 3: 2,64 мкс на петлю
в) 100000 петель, лучшее из 3: 11,9 мкс на петлю
d) 100000 петель, лучшее из 3: 4,92 мкс на петлю
e) 100000 петельлучшее из 3: 2,96 мкс на цикл
f) 100000 циклов, лучшее из 3: 4,29 мкс на цикл
г) 100000 циклов, лучшее из 3: 4,68 мкс на цикл
ч) 100000 петель, лучшее из 3: 4,73 мкс на петлю
i) 100000 петель, лучшее из 3: 4,24 мкс на петлю

И сдлинная входная строка (## *Something* and [another] thing in a longer sentence with {more} things to replace$):

a) 100000 циклов, лучшее из 3: 7,59 мкс на цикл
b) 100000 циклов, лучшее из 3: 6,54 мкс на цикл
в) 100000 петель, лучшее из 3: 16,9 мкс на петлю
d) 100000 петель, лучшее из 3: 7.29 мкс на цикл
д) 100000 циклов, лучшее из 3: 12,2 мкс на цикл
f) 100000 циклов, лучшее из 3: 5,38 мкс на цикл
г) 10000 петель, лучшее из 3: 21,7 мкс на петлю
ч) 100000 петель, лучшее из 3: 5,7 мкс на петлю
i) 100000 петель, лучшее из 3: 5,13 мкс на петлю

Добавление пары вариантов:

def ab(text):
    for ch in ['\\','`','*','_','{','}','[',']','(',')','>','#','+','-','.','!','$','\'']:
        text = text.replace(ch,"\\"+ch)


def ba(text):
    chars = "\\`*_{}[]()>#+-.!$"
    for c in chars:
        if c in text:
            text = text.replace(c, "\\" + c)

С более коротким вводом:

ab) 100000 циклов, лучшее из 3: 7,05 мкс на цикл
ba) 100000 циклов, лучшее из 3: 2,4 мкс на цикл

С более длинным входом:

ab) 100000 циклов, лучшее из 3: 7,71 мкс на цикл
ba) 100000 циклов, лучшее из 3: 6,08 мкс на цикл

Итак, я собираюсь использовать ba для удобства чтения и скорости.

Приложение

По подсказкам хаков в комментариях, одно отличие между ab и ba - это if c in text: проверять.Давайте проверим их по двум другим вариантам:

def ab_with_check(text):
    for ch in ['\\','`','*','_','{','}','[',']','(',')','>','#','+','-','.','!','$','\'']:
        if ch in text:
            text = text.replace(ch,"\\"+ch)

def ba_without_check(text):
    chars = "\\`*_{}[]()>#+-.!$"
    for c in chars:
        text = text.replace(c, "\\" + c)

Время в мкс на цикл в Python 2.7.14 и 3.6.3 и на компьютере, отличном от предыдущего набора, поэтому не может сравниваться напрямую.

╭────────────╥──────┬───────────────┬──────┬──────────────────╮
│ Py, input  ║  ab  │ ab_with_check │  ba  │ ba_without_check │
╞════════════╬══════╪═══════════════╪══════╪══════════════════╡
│ Py2, short ║ 8.81 │    4.22       │ 3.45 │    8.01          │
│ Py3, short ║ 5.54 │    1.34       │ 1.46 │    5.34          │
├────────────╫──────┼───────────────┼──────┼──────────────────┤
│ Py2, long  ║ 9.3  │    7.15       │ 6.85 │    8.55          │
│ Py3, long  ║ 7.43 │    4.38       │ 4.41 │    7.02          │
└────────────╨──────┴───────────────┴──────┴──────────────────┘

Мы можем сделать вывод, что:

Те, у кого есть чек, в 4 раза быстрее, чем те, у кого нет чека
ab_with_check немного лидирует на Python 3, но ba (с проверкой) имеет большее преимущество на Python 2
Однако самый большой урок здесь - Python3 до 3 раз быстрее, чем Python 2 !Нет большой разницы между самым медленным на Python 3 и самым быстрым на Python 2!

ghostdog74 · Answer 2 · 05 августа 2010

>>> string="abc&def#ghi"
>>> for ch in ['&','#']:
...   if ch in string:
...      string=string.replace(ch,"\\"+ch)
...
>>> print string
abc\&def\#ghi

thefourtheye · Answer 3 · 09 мая 2014

Просто включите replace функции, подобные этой

strs = "abc&def#ghi"
print strs.replace('&', '\&').replace('#', '\#')
# abc\&def\#ghi

Если число замен будет больше, вы можете сделать это общим способом

strs, replacements = "abc&def#ghi", {"&": "\&", "#": "\#"}
print "".join([replacements.get(c, c) for c in strs])
# abc\&def\#ghi

tommy.carstensen · Answer 4 · 10 февраля 2018

Вот метод python3 с использованием str.translate и str.maketrans:

s = "abc&def#ghi"
print(s.translate(str.maketrans({'&': '\&', '#': '\#'})))

Напечатанная строка: abc\&def\#ghi.

kennytm · Answer 5 · 05 августа 2010

Вы всегда собираетесь добавить обратную косую черту?Если это так, попробуйте

import re
rx = re.compile('([&#])')
#                  ^^ fill in the characters here.
strs = rx.sub('\\\\\\1', strs)

Возможно, это не самый эффективный метод, но я думаю, что он самый простой.

Victor Olex · Answer 6 · 16 февраля 2011

Вы можете написать общую функцию escape:

def mk_esc(esc_chars):
    return lambda s: ''.join(['\\' + c if c in esc_chars else c for c in s])

>>> esc = mk_esc('&#')
>>> print esc('Learn & be #1')
Learn \& be \#1

Таким образом, вы можете настроить свою функцию с помощью списка символов, который должен быть экранирован.

Sebastialonso · Answer 7 · 30 марта 2019

Поздно до вечеринки, но я потерял много времени на эту проблему, пока не нашел свой ответ.

Короткий и сладкий, translate превосходит replaceЕсли вас больше интересует функциональность с течением времени, не используйте replace.

Также используйте translate, если вы не знаете, перекрывает ли набор заменяемых символов набор символов, используемых для замены.

Показательный пример:

Используя replace, вы наивно ожидаете, что фрагмент "1234".replace("1", "2").replace("2", "3").replace("3", "4") вернет "2344", но на самом деле он вернет "4444".

Перевод, кажется, выполняет то, что первоначально желал OP.

parity3 · Answer 8 · 30 января 2016

К вашему сведению, это мало или вообще не полезно для ОП, но может быть полезно другим читателям (пожалуйста, не понижайте голос, я знаю об этом).

Как несколько нелепое, но интересное упражнение, я хотел посмотреть, смогу ли я использовать функциональное программирование на Python для замены нескольких символов. Я почти уверен, что это НЕ побеждает, просто вызывая replace () дважды. И если производительность была проблемой, вы могли бы легко победить это в ржавчине, C, Julia, Perl, Java, Javascript и, возможно, даже awk. Он использует внешний пакет «помощников» под названием pytoolz , ускоренный через cython ( cytoolz, это пакет pypi ).

from cytoolz.functoolz import compose
from cytoolz.itertoolz import chain,sliding_window
from itertools import starmap,imap,ifilter
from operator import itemgetter,contains
text='&hello#hi&yo&'
char_index_iter=compose(partial(imap, itemgetter(0)), partial(ifilter, compose(partial(contains, '#&'), itemgetter(1))), enumerate)
print '\\'.join(imap(text.__getitem__, starmap(slice, sliding_window(2, chain((0,), char_index_iter(text), (len(text),))))))

Я даже не собираюсь объяснять это, потому что никто не потрудится использовать это для выполнения множественной замены. Тем не менее, я почувствовал, что достиг этого, и подумал, что это может вдохновить других читателей или выиграть конкурс обфускации кода.

CasualCoder3 · Answer 9 · 29 января 2018

Используя Reduction, доступный в python2.7 и python3. *, Вы можете легко заменить множественные подстроки чистым и pythonic способом.

# Lets define a helper method to make it easy to use
def replacer(text, replacements):
    return reduce(
        lambda text, ptuple: text.replace(ptuple[0], ptuple[1]), 
        replacements, text
    )

if __name__ == '__main__':
    uncleaned_str = "abc&def#ghi"
    cleaned_str = replacer(uncleaned_str, [("&","\&"),("#","\#")])
    print(cleaned_str) # "abc\&def\#ghi"

В python2.7 вам не нужно импортировать Reduce, но в Python3. * Вы должны импортировать его из модуля functools.

jonesy · Answer 10 · 16 февраля 2011

>>> a = '&#'
>>> print a.replace('&', r'\&')
\&#
>>> print a.replace('#', r'\#')
&\#
>>>

Вы хотите использовать «необработанную» строку (обозначаемую «r» префиксом замещающей строки), поскольку необработанные строки не обрабатывают обратный слеш специально.

Замена нескольких символов на Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Замена двух символов

Замена 17 символов

Приложение

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Замена нескольких символов на Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Замена двух символов

Замена 17 символов

Приложение

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов