SQL Сервер: найти дубликаты в столбце ntext - PullRequest
0 голосов
/ 31 января 2020

У меня есть таблица в базе данных SQL Server 2000, в которой есть следующие столбцы:

id: Primary Key, bigint, auto increment
CustomerID: Foreign Key, int
Received_Time: bigint (epoch time of received report)
XML_Report: ntext (raw XML file. Typically ~100kb but some reports are >100MB in size)

Имеется около 750 КБ строк, а размер таблицы составляет около 50 ГБ.

I обнаружили, что есть несколько дублирующих отчетов, в которых значения XML_Report абсолютно одинаковы. Я пытаюсь измерить количество дубликатов с помощью следующего запроса:

SELECT [XML_Report], COUNT(*) 
FROM [Reports] 
GROUP BY [XML_Report]

, но SQL Сервер возвращает:

Текст, ntext и Типы данных изображений нельзя сравнивать или сортировать, кроме случаев использования оператора IS NULL или LIKE.

Есть ли способ получить количество дублированных отчетов?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...