Найти неанглийские символы довольно просто.Решение @moudiz решит эту проблему .Но для определения того, написано ли тело текста на английском или другом языке, требуется некоторая форма возможностей AI / ML, которая не входит в стандартную комплектацию СУБД Oracle.
Одной из возможностей может быть Oracle Text.World Lexer имеет поддержку автоопределения для ряда языков.Возможно, будет возможность разобраться в том, есть ли фрагмент текста на английском языке. Узнайте больше .(Предостережение: голубое небо думает здесь, никогда не пробовал ничего подобного.)
Другим решением было бы создание пакета PL / SQL, который вызывает Google Translate API.detect()
может идентифицировать язык пропущенного текста. Узнайте больше .
Существует несколько очевидных ошибок:
- Многие организации возражают против передачи текста из базы данных на внешний сайт, напримерGoogle.
- Если у вас есть много данных для проверки, лицензирование обойдется дорого.