Я не уверен, что это можно (или, возможно, следует) сформулировать в запросе SQL. Вы можете просто выполнить итерацию по всей базе данных и посмотреть, являются ли каждая строка действительными данными UTF-8, выводя ключи для строк, которые не являются. Я не уверен, есть ли в PHP готовая функция для проверки, «правильны ли эти байты UTF-8», но в Python есть, - если вы это знаете, вы могли бы это рассмотреть. Однажды я написал программу для этого, потому что у меня были похожие проблемы. (У меня нет исходного кода, извините.)
Следует помнить одну вещь: возможно, но маловероятно, что строка, случайно сохраненная и закодированная как ISO-8859-1, также является допустимой строкой UTF-8.
Я не знаю, как MySQL обрабатывает строки, но позволяет ли MySQL вставлять строку, отличную от UTF-8, в базу данных UTF-8? (Например, PostgreSQL не позволит вам сделать это в базах данных UTF-8.)