SQL - найти все примеры значений во всех столбцах с заданной характеристикой - PullRequest
1 голос
/ 16 апреля 2020

У меня есть набор данных (8,5 млн строк), где все значения во всех столбцах должны быть заключены в символы кавычек (""). Я обнаружил, что есть проблема - некоторые записи содержат значения в некоторых столбцах, при этом отсутствует последний символ кавычки. Теперь мне нужно попытаться получить общее представление о проблеме - в каких столбцах есть примеры этой ошибки (это происходит из-за усечения выше в решении).

Из примера фиктивных данных, вставленных ниже:

Как написать запрос, который выводит столбцы «Фамилия» и «Возраст» из-за отсутствующей конечной цитаты в строках 2 и 3 в этих колонках? Чтобы было понятно - как определить столбцы с усеченными значениями sporadi c?

Пример данных с отсутствующими символами кавычек

Спасибо,

knn

1 Ответ

1 голос
/ 16 апреля 2020

Вам необходимо проверить последний символ в строке. Это делается с помощью функции подстроки, передача аргумента -1 означает последний символ. И вы проверяете, не отличается ли он от символа двойной кавычки.

SELECT * FROM YourTable
WHERE 
substr("Last Name", -1) <> '"' OR substr(Age,-1) <> '"'

Вы можете поиграть с ним здесь http://sqlfiddle.com/#! 4 / 10a77e / 1

...