Есть много символов, которые (обычно) используются только на японском языке или только на китайском.
Япония и Китай упростили многие символы, но часто по-разному. Вы можете проверить японские иероглифы Синдзитай и Упрощенный китайский. Есть намного больше из последних, чем первый. Если нет ни того, ни другого, то, вероятно, у вас есть традиционный китайский.
Конечно, если вы имеете дело с текстом Unicode, вы можете встретить редкие символы или смешанные языки, которые могут вызвать эвристику, поэтому вам лучше посчитать типы символов для вынесения суждения.
Хороший способ выяснить, какие символы встречаются на одном языке, а не на других, - сравнить устаревшие кодировки друг с другом. Вы можете легко найти сопоставления каждого из них в Unicode в Интернете.
Раньше у меня был какой-то написанный код, который выполнял двоичный поиск по кодам, и он был очень быстрым даже в JavaScript - хотя я мог потерять его в своих путешествиях (-: