Я хочу преобразовать текст на хинди / деванагари, например "आए थे पर्यटक, खुद ही बह ग", в символы с экранированием Unicode, такие как "\ u0906 \ u090f \ u0925 \ u092a \ u0930 \ u094d \ u092f \ u091f \ u0915, \ u0916 \ u0926 \ u0939 \ u092c \ u0939 \ u0917 ".
Я занимаюсь разработкой веб-сайта на хинди, и я видел, что большинство сайтов используют последовательность Escaped Unicode внутри своих мета-тегов и schema.org.
Поэтому я решил попробовать.
я вижу буквы хинди акаа деванагари с их последовательностью Escaped Unicode на http://www.endmemo.com/unicode/devanagari.php
и я также видел инструмент, который работает так же https://www.mobilefish.com/services/unicode_escape_sequence_converter/unicode_escape_sequence_converter.php
но я не могу найти какой-либо способ конвертировать эти буквы деванагари в последовательность Escaped Unicode через php.
Я пробовал несколько вещей, но ничего не работает, и я не получаю большую помощь от Google, потому что все статьи / форумы говорят о декодировании escape-последовательности Юникода в Юникод, но ни одна из них не касается кодировки ..
header( 'Content-Type: text/html; charset=utf-8' );
function encode2($str) {
$str = mb_convert_encoding($str , 'UTF-32', 'UTF-8');
$t = unpack("N*", $str);
$t = array_map(function($n) { return "&#$n;"; }, $t);
return implode("", $t);
}
$message = "आए थे पर्यटक, खुद ही बह गए";
$message_convert = encode2($message);
echo $message_convert;
echo "fdfdfdfdfdfdfd<br/>";
echo mb_convert_encoding($message, "HTML-ENTITIES", "auto");
Я хочу, чтобы это "पर्यटक थे पर्यटक, खुद ही बह ग" "\ u0906 \ u090f \ u0925 \ u092a \ u094d \ u092f \ u091f \ u0915, \ u0916 \ u0941 \ u0926 \ u0939 \ u0940 \ u0940 u092c \ u0939 "
Пожалуйста, помогите!