Отображаемая строка в Pandas кадре данных - PullRequest
0 голосов
/ 06 августа 2020

В записной книжке Jupyter у меня есть следующий код:

test = {'cashtag': ['$ text here $ this is a test $ TEST $:']}
dft = pd.DataFrame.from_dict(test)
display(dft)

Результат в результате:

Щелкните, чтобы увидеть результат

????ℎ??? это тест ????:

Как показано, по какой-то причине все кэштеги исчезли, а оставшийся текст написан на итальянском c. Как сделать так, чтобы текст отображался в точности так, как было изначально набрано (с кэштегами, без itali c)? интерпретирует все, что находится между знаками доллара, как выражение MathJax.

Простым решением было бы поместить две обратные косые черты перед '$' (\\ $). Однако реальный набор данных, с которым я работаю, содержит десятки миллионов строк и, возможно, сотни миллионов долларов. Написание кода для размещения '\' перед каждым '$' сильно повлияет на производительность.

Есть ли способ исправить эту проблему на уровне 'root', не позволяя i Python интерпретировать '$' как MathJax при любых обстоятельствах?

Ответы [ 3 ]

1 голос
/ 06 августа 2020

Это достигается с помощью:

import pandas as pd
pd.options.display.html.use_mathjax = False
0 голосов
/ 06 августа 2020

$ обрабатывается как инструкция форматирования для отображения курсивом

test = {'cashtag': ['$ text here \ this is a test $ TEST $:'.replace("$","\$")]}
dft = pd.DataFrame.from_dict(test)
display(dft)
0 голосов
/ 06 августа 2020

Вы можете попытаться удалить '$' перед анализом ваших данных. В pandas '$' может поставить вас в положение, когда ваш DataFrame обрабатывает другие числовые c значения как строки, вызывая проблемы c проблемы, если вы хотите использовать числовые c значения для анализа данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...