Вам следует создать просмотр в браузере (или запустить экземпляр в режиме отладки) и запустить этот код:
from Products.CMFCore.utils import getToolByName
import re
ctool = getToolByName(context, 'portal_catalog')
results = ctool.searchResults(portal_type='Document')
for i in results:
obj = i.getObject()
text = obj.getField('text').get(obj)
<find and remove your html using the regular expression module>
obj.reindexObject()
Если вам нужно сделать это много раз, вы можете добавить свой пользовательский индекс , что упрощает работу.