В записной книжке Jupyter у меня есть следующий код:
test = {'cashtag': ['$ text here $ this is a test $ TEST $:']}
dft = pd.DataFrame.from_dict(test)
display(dft)
Результат в результате:
Щелкните, чтобы увидеть результат
????ℎ??? это тест ????:
Как показано, по какой-то причине все кэштеги исчезли, а оставшийся текст написан на итальянском c. Как сделать так, чтобы текст отображался в точности так, как было изначально набрано (с кэштегами, без itali c)? интерпретирует все, что находится между знаками доллара, как выражение MathJax.
Простым решением было бы поместить две обратные косые черты перед '$' (\\ $). Однако реальный набор данных, с которым я работаю, содержит десятки миллионов строк и, возможно, сотни миллионов долларов. Написание кода для размещения '\' перед каждым '$' сильно повлияет на производительность.
Есть ли способ исправить эту проблему на уровне 'root', не позволяя i Python интерпретировать '$' как MathJax при любых обстоятельствах?