Я пытаюсь загрузить CSV, в котором есть столбец с несколькими языками и несколькими символами. После того, как они были организованы, я не уверен, что лучше выбрать или выполнить поиск в этом столбце.
Вот пример нескольких строк csv, извинения за плохое форматирование, я не могу поделиться данными, но это сходство ниже:
+----+--------------+-----------+----------------------------------------------------------------------+
| id | username | tweet_id | tweet_content |
+----+--------------+-----------+----------------------------------------------------------------------+
| 03 | generationz | 123345 | "toto je nejlepší zpětná vazba na světě" |
| 04 | generationz | 122334 | "¿Dónde está el mejor lugar para comer? estoy realmente hambriento" |
+----+--------------+-----------+----------------------------------------------------------------------+
Если эти данные будут искать в этом столбце, как лучше всего выполнить преобразование или индексацию со специальными символами?