У меня есть набор данных, который включает столбец с некоторым текстом (тексты песен).
иногда в тексте есть слова (или символы), не декодированные правильно, вот пример:
'I keep trying Ainâ\\x80\\x99t no denyingWe should be together nowI canâ\\x80\\x99t imagineYouâ\\x80\\x99re with another man Baby'
в этом случае при поиске исходного текста эти «коды» (â \ x80 \ x99) указывают на одинарную кавычку - апостроф - но у меня много строк, и я не могу проверить каждую из них, а также у меня есть текст из таких языков, как русский, китайский, греческий и так далее ...
Я думал использовать регулярное выражение и найти все эти подстроки, но я не знаю, такой же шаблон (буква, две backsla sh, x плюс два числа)
или есть просто какой-то аргумент кодировки, который "читает" все символы?
спасибо за вашу помощь!