Как я могу преобразовать значение после его извлечения? - PullRequest
0 голосов
/ 30 августа 2018

Я использую Portia для извлечения информации со страницы. Однако одно из извлеченных значений не в формате, который я могу использовать.

В частности, я хочу извлечь числовое значение, которое использует точку вместо запятой для обозначения тысяч, например. «1000» вместо «1000».

Можно ли извлечь и затем преобразовать с помощью Portia? Я могу установить регулярное выражение для извлечения чисел, но возможно ли их заменить?

Что я делаю сейчас, так это то, что я экспортирую данные в csv, а затем использую sed для замены рассматриваемых чисел.

Спасибо

1 Ответ

0 голосов
/ 30 августа 2018

Проверка: Как использовать Python для преобразования строки в число, если в ней есть запятые в качестве разделителей тысяч?

import locale
locale.setlocale( locale.LC_ALL, 'de_DE.UTF-8' )
locale.atoi('1.000')
# 1000

В основном это строка в число с правильной маской формата

...