Как извлечь денежную стоимость из "кассовой" строки в IMDbPY - PullRequest
0 голосов
/ 13 ноября 2011

Я хотел бы извлечь денежную стоимость при использовании IMDbPY для извлечения данных из IMDB.

Моя проблема заключается в том, что IMDbPY возвращает результаты в следующем формате, что является строкой Unicode:

In : movie['business']['gross'][0]
Out: u'$134,966,411 (USA) (11 May 1997)'

Кроме того, иногда присутствует дата, иногда нет.

Можете ли вы помочь мне , как извлечь число из этой строки, без случайного распознавания части даты / года ?

Символ валюты и код страны не важны.

1 Ответ

0 голосов
/ 13 ноября 2011

re.match с этим шаблоном:

r"\$([1-9][0-9,]+)"
...