Я пытаюсь очистить и очистить данные Википедии.У меня есть поле данных, которое содержит измерения, как показано ниже.
["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m",
"109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 metres by 70 metres"]
Извлечь размеры достаточно просто, но извлечь единицу довольно сложно, учитывая, сколько существует вариантов записей.Как лучше всего подойти к этому?
Я начал с использования:
"(\d+\.?\d*)"
, который должен извлечь все измерения, я собирался сохранить только первые 2 числовые совпадения,сохранить первое совпадение единицы измерения («м», «метр», «метры», «у», «ярд», «ярды», «yd», «футы» ...) и затем я могу преобразоватьвсе в метрах позже.
Я просто не уверен в том, как бы я сохранил соответствие первого блока.