Я пытаюсь найти ресурс, который можно использовать для подключения языков (или, скорее, сценариев) к блокам символов Юникода.Такой ресурс будет использоваться для поиска таких вопросов, как "Какие блоки Unicode используются на французском языке?"или "На каких языках используется блок из 0A80-0AFF (http://unicodinator.com/#Block-Gujarati)?" Знаете ли вы о таком ресурсе?
) Я ожидал бы, что смогу легко найти эту информацию в Unicode.org . Мне быстро удалось найти отличную таблицу, которая связывает коды стран с языками (http://unicode.org/repos/cldr-tmp/trunk/diff/supplemental/territory_language_information.html).) Но я потратил немало времени на поиски чего-либо, связанного с блоками Unicode и языками.Возможно, у меня есть проблема с терминологией, мешающая мне соединить точки здесь ...
Я не привередлив в том, что именно означает "язык" (код локали Java или код ISO 639 или любой другой)в этом случае. Я также понимаю, что не может быть точных ответов, потому что, например, арабский документ может содержать латинский и другой текст в дополнение к символам из арабских блоков (http://unicodinator.com/#Block-Arabic, http://unicodinator.com/#Block-Arabic_Supplement). Нонаверняка должна быть таблица с надписью "эти языки идут с этими блоками" ... я тоже не разборчив в формате (XML, CSV, что угодно), я легко могупреобразовать это в данные, которые я могу использовать для своего приложения.И снова, я понимаю, что ссылка, вероятно, соединит Сценарии с блоками, а не с языками (хотя сценарии могут быть сопоставлены с языками).
Я понимаю, что это будет многомного таблиц (поскольку многие языки используют символы из нескольких блоков, а многие блоки используются несколькими языками);Я действительно понимаю, что на это нельзя дать точного ответа, поскольку кодовые точки Unicode не зависят от языка - однако, также не может быть и вопроса «какие языки существуют в этой стране» (ответ, вероятно, «большинство из них» для большинства стран), но таблицавот так (http://unicode.org/repos/cldr-tmp/trunk/diff/supplemental/territory_language_information.html) все еще можно создавать, значимые и полезные.
Что касается , почему Я бы хотел такую вещь: Я хотел бы улучшить http://unicodinator.com с глобальными тепловыми картами для блоков кода и списками языков; у меня также есть концепция игры, с которой я возился. Помимо этого, возможно, есть много других применений, которые другие люди могли бы использовать для этого (создание шрифтов? Эвристический,быстрое определение языка предположений теперь, когда API Google Translate исчезает - исследовательские проекты?).