У меня есть небольшая текстовая строка с тегами, похожими на xml:
<sub>A</sub>B<sup>C</sup>
Мне нужно проанализировать этот текст и выполнить действия на основе тегов.Таким образом, приведенный выше текст будет выглядеть как A B C в моем целевом приложении (MS Excel - Excel может анализировать и форматировать эту строку, если я вставлю ее, но не если я просто введу ее вячейка).
Как лучше всего анализировать текст на основе тегов с точки зрения производительности.Код форматирования будет вызываться очень часто, и я хочу максимально сократить накладные расходы.Я могу думать о следующих параметрах:
- Анализировать его символ за символом, используя индексатор, отслеживая, когда тег начинался / заканчивался
- Использовать регулярные выражения
- Загрузитьэто в некоторый XML / HTML DOM Parser и итерацию по узлам
Какой из них, по вашему мнению, окажет наименьшее влияние на производительность?Есть ли другой способ выполнить задачу?