Я получаю текст из Интернета. В тексте иногда встречаются такие символы, как "& a m p;", "& q u o;;" и т. Д.
Я полагаю, что это какие-то символы юникода в HTML. это строка в кодировке HTML, спасибо Джейсону за указание.
Как мне отфильтровать все эти вещи из текста? Я не хочу никаких символов кода, связанных с HTML. кстати, я не говорю о HTML-тегах в тексте, только о таких видах Юникода.
спасибо