У меня есть строка (комментарий Javadoc), которая содержит <code>...
теги.Это выглядит примерно так:
<code>System.out</code>.
@param project The project to display a description of.
Must not be <code>null;</code>.
Я хочу иметь возможность удалять запятую (,), точку остановки (.) И точку с запятой (;) между тегами <code>..
.
Это должно выглядеть примерно так:
<code>Systemout</code>.
@param project The project to display a description of.
Must not be <code>null</code>.
Я пробовал следующее:
from bs4 import BeautifulSoup
var = '''Prints the description of a project (if there is one) to
<code>System.out</code>.
@param project The project to display a description of.
Must not be <code>null;</code>.'''
soup = BeautifulSoup(var, 'html.parser')
for a in soup.find_all('code'):
print (a.string)
Но это извлечение текста между ними.Я действительно не знаю, чтобы удалить запятую, точку остановки и точку с запятой и добавить его обратно к исходной строке.Любая помощь будет принята с благодарностью!
РЕШЕНИЕ
matches = re.sub('<code>(.*?)</code>', lambda m: "<code>{}</code>".format( m.group(1).replace(".","").replace(",","").replace(";","")), var, flags=re.DOTALL)