База данных SQLite показывает знаки вопроса (???) вместо этих символов Unicode (தமிழ்) - PullRequest
0 голосов
/ 06 мая 2018

Я импортировал CSV-файл, содержащий Unicode, в базу данных SQLite, но вместо того, чтобы видеть текст, все, что я вижу, это вопросительные знаки. Как это, "???". Кодировка UTF-8 (я упомянул ниже, что случилось, когда я попробовал UTF-16). Менеджер SQLite, который я использую - это DB Browser для SQLite.

Это Unicode, который я набрал: 100

Теперь, согласно этому ответу в Stackoverflow, SQLite сохраняет текстовые данные в формате Unicode. Таким образом, факт, что мой текст - Unicode, не может быть проблемой.

Персонажи, которые я пытаюсь использовать, принадлежат к тамильскому языку. Я пытаюсь использовать его с Unicode. Согласно Википедии, кодировка для тамильского языка называется TACE16. Это 16-битная кодировка Unicode.

Итак, я установил кодировку UTF-16, когда импортировал файл CSV. Но файл даже не отображается в базе данных после импорта, когда я это делаю. Но он говорит, что импорт успешен.

Затем я попытался импортировать файл CSV с кодировкой UTF-8, как обычно. Но после импорта я щелкнул правой кнопкой мыши заголовок строки, выбрал «Установить кодировку» и установил его в UTF-16. Теперь он не показывает вопросительные знаки, но показывает что-то вроде китайских иероглифов. Вот что он показывает сейчас: 101 㼿.

Я пытался установить TACE16 при импорте. Я также попытался установить его вручную. Но там говорится, что это либо неправильная кодировка, либо она не поддерживается.

Дальнейший поиск в Интернете ничего не дал. Может кто-нибудь сказать мне, как я могу решить эту проблему? По сути, я хочу, чтобы этот текст «தமிழ்» отображался в базе данных SQLite после импорта файла CSV, в котором есть текст.

Спасибо большое. Буду очень признателен за вашу помощь.

Ответы [ 2 ]

0 голосов
/ 06 мая 2018

ОК, оказывается, проблема была в моем CSV-файле. Я отредактировал его в Excel и, думаю, Excel сохранил его, используя другую кодировку. Я все еще не уверен, в чем именно проблема, но я просто напишу о том, как я это исправил.

Я открыл Блокнот и набрал данные, разделенные запятыми. Я сохранил файл с расширениями CSV. Вот важная вещь. Вы должны изменить кодировку на Unicode. Слева от кнопки сохранения есть выпадающее меню. Используйте это. Вот ссылка на YouTube видео , которая показывает вам, как.

Кроме того, вам не нужно вводить все в блокноте. Это может стать утомительным.

Введите все в таблицы Google и экспортируйте его в виде файла CVS. Оно работает. Если вам нужно использовать Блокнот, введите данные в Excel, объедините все в каждой строке с помощью формулы и скопируйте и вставьте их в блокнот. Не забудьте добавить запятую между каждой информацией о ячейке, используя формулу в Excel.

0 голосов
/ 06 мая 2018

Однажды у меня была похожая проблема, но в моем случае проблема была только в программном обеспечении БД, которое я использовал для визуализации таблиц БД. Вы пытались получить ваши данные из базы данных? Они правы, когда вы их извлекаете? В любом случае, если вы сообщите нам, какие именно инструменты вы используете для выполнения того, что невозможно найти решение в вашем конкретном случае.

...