У вас нет действительного документа XML; если вы обнаружите, что большая часть (или все) ваших входных данных похожа на эту, вы можете легко обернуть содержимое в фиктивные теги, чтобы гарантировать, что синтаксические анализаторы не потерпят неудачу (при условии, что содержимое внутреннего узла является действительным, если оно является содержимым другого элемента XML), например так:
<root>
hi hello <bbb name='ahhahdch'>MR.JKROY</bbb>.how are you.Let's meet
<bbb name='bbcbc'>SUSANNE</bbb>. Our team lead is <bbb name='cdcdcd'>JACK</bbb>, from .net.
</root>
Как только у вас есть действительный XML-документ, вы можете затем использовать XmlDocument
класс для анализа содержимого, а затем получить текст с удаленными элементами, используя InnerText
свойство :
string xml = <content from above>;
var doc = new XmlDocument();
doc.LoadXml(xml);
// Gives you only the text.
Console.WriteLine(doc.InnerText);
Или используйте XDocument
класс , а затем получите текст из Value
свойства в XElement
, выставленном Root
собственность на XDocument
:
XDocument doc = XDocument.Parse(xml);
// Gives you only the text.
Console.WriteLine(doc.Root.Value);