У меня длинный список значений Unicode, разделенных точкой с запятой.Вот пример:
E0027;TAG APOSTROPHE;Cf;0;BN;;;;;N;;;;;
Все, что мне нужно, это "E0027;"part.
Итак, сначала мне нужно добавить все в строке ПОСЛЕ первой точки с запятой, но в некоторых случаях точка с запятой идет после 4 цифр, в других случаях (как указано выше) - после 5. Если это былото же самое повсюду я бы усек после фиксированного числа символов.Я нашел много примеров для выполнения различных манипуляций с awk, но нет регулярных выражений, которые бы подходили именно этому случаю.Кто-нибудь знает, что такое правильный синтаксис?Логика состоит в том, чтобы просто хранить все ДО первой точки с запятой и отбрасывать все после нее.
Затем для полученного файла мне нужно добавить начальный 0 в строку, если число составляет всего 4 символа.Так, например:
8A9B;
Должен стать:
08A9B;
Но 5-значные значения (как в первом примере) должны оставаться как есть ... без начального нуля.
(Хотя будет ли дополнительный начальный ноль иметь значение, если я использую эти значения в HTML? Было бы важно, если бы у меня было:
󠀧
Вместо:
󠀧
Если они будут обрабатываться PHP одинаково и не будут иметь значения, я думаю, что последняя часть не так важна (хотя с тысячами дополнительных нулей это увеличит размер кода).
Заранее благодарю за любую помощь!