Программно найти и изменить HTML на страницах моего сайта Plone - PullRequest
0 голосов
/ 28 сентября 2011

Я хочу найти все документы внутри довольно большого сайта Plone, который содержит определенный фрагмент HTML в теле (список элементов с заголовками внутри, ург ...) , а затем изменить это HTML (опустить заголовки).

Указатели на то, как это сделать, очень ценятся!

Ответы [ 2 ]

1 голос
/ 28 сентября 2011

Вам следует создать просмотр в браузере (или запустить экземпляр в режиме отладки) и запустить этот код:

from Products.CMFCore.utils import getToolByName
import re


ctool = getToolByName(context, 'portal_catalog')
results = ctool.searchResults(portal_type='Document')
for i in results:
    obj = i.getObject()
    text = obj.getField('text').get(obj)
    <find and remove your html using the regular expression module>
    obj.reindexObject()

Если вам нужно сделать это много раз, вы можете добавить свой пользовательский индекс , что упрощает работу.

0 голосов
/ 28 сентября 2011

Я давно не пробовал, но посмотрите GoReplace

...