Я хочу извлечь число из списка указанных c символов. Я хочу извлечь объем, Pirce и многое другое с разных веб-сайтов.
Например, я хочу извлечь Том отсюда:
<td class="data">Single Malt Scotch Whisky der Marke Speyburn 10 Years 40% 0,7l Flasche</td>
or
<td class="data">Irish Whiskey der Marke Bushmills the Original 40% 1,0l Flasche</td>
Я попробовал следующий код:
re.findall("[-+]?[.]?[\d]+(?:,\d\d\d)*[\.]?\d*?(?=l|L|Liter| Liter| l| L|ml)", string)
И вот результат:
First String = ['7'] and Second String = ['0']
Как получить полное число (0,7 и 1,0)?
Для тома, который я пытался преобразовать запятой в точку. Это прекрасно работает для объема, но не для цены.
if ',' in string:
string= string.replace(',', '.')
Если это возможно, я хочу использовать регулярное выражение также для цены. Сложность здесь заключается в разных типах чисел. Доступны следующие типы:
- 10,00 €
- 10,00 €
- 1234,56 €
- 1,234,56 €