У меня есть следующая строка: «AZS40G - это алюмосиликатный циркониевый материал с содержанием ZrO2 не менее 39%, который служит отличным заменителем в приложениях для производства спеченных огнеупоров AZS и где требуется муллит из плавленого циркона. C1R5».
Я хотел бы использовать регулярное выражение, чтобы найти все цифры в химических формулах в тексте (экземпляры букв, предшествующих цифрам, за исключением сокращений обозначений, т. Е. «AZS40G» в данном случае, и обернуть их тегом <sub></sub>
.
Я делаю все это в php, и поскольку я не знаю, с чего начать с регулярного выражения, я предоставил следующий пример псевдокода / php:
$text = "AZS40G is Alumina Zircon Silicate material with ZrO2 content of 39% minimum, which serves as a great substitute in applications for production of sintered AZS refractories and where the Fused Zircon mullite is required. Zr5O2, M20R2, C1R5";
preg_replace('/(AZS40G!)(?<=[A-Z])\d+/', '<sub>${1}</sub>', $text);
Ожидаемый результат будет для всех случаев следующим образом:
У меня есть следующая строка: «AZS40G - это глинозем Циркон Силикатный материал с содержанием ZrO 2 минимум 39%, который служит отличным заменителем в приложениях для производства спеченных огнеупоров AZS и где плавленый циркон требуется муллит. C 1 R 5".