MYSQL Workbench продолжает импортировать недопустимые символы для столбца 'id' - PullRequest
0 голосов
/ 16 апреля 2020

Я продолжаю пытаться импортировать файл CSV длиной около 4000 символов в мою базу данных MYSQL через WorkBench ...

Каждый раз, когда в столбце идентификатора есть недопустимый символ.

Почему MYSQL Workbench делает это?

Прямо сейчас он говорит \ ufeffid ... так что есть некоторый символ \ ufeff перед 'id'.

Я экспортировал свой файл XLSX в формате CSV. Эти символы не должны быть.

1 Ответ

1 голос
/ 16 апреля 2020

Это символ Unicode BOM (кодовая точка / глиф), пробел нулевой ширины, используемый для пометки файлов Unicode как первого символа в файле. Это избыточно (плохая практика, как мы видим), но Windows Блокнот обнаруживает UTF-8 вместо локальной кодировки.

При ручном копировании первой строки этот символ спецификации может быть скопирован в несколько строк в файл.

Каким-то образом где-то вам нужно от них избавиться.


О спецификации, Порядок следования байтов:

Юникод нумерует все возможные символы, кодовые точки, символы. Преобразование в двоичные данные происходит в форме UTF-8 (многобайтовый), UTF-16LE (младший порядок), UTF-16BE (старший порядок) и UTF-32 LE / BE. По символу спецификации можно определить кодировку. Для этого это U + FEFF, два разных байтовых значения.

...