Вы хотите выбросить строку "Цена по запросу"?Или это ценная информация?
Если в данных много шума и они бесполезны, я бы запустил фильтр, чтобы удалить все нецифровые символы.
Но, если позволяет время, я предпочитаю явно обрабатывать данные с помощью сопоставления с образцом (пример кода - PHP):
//$price is raw string
$price=str_replace(',','',$price); //Get rid of commas
$price=str_replace('$','',$price); //Get rid of dollar signs
if($price=='Price On Ask')$price=null;
elseif(preg_match('/^\d+$/',$price))$price=(int)$price; //Simple number
elseif(preg_match('/^(\d+) Price On Ask$/i',$price,$parts)){
$price=(int)$parts[1];
}
else{
echo "Unexpected price string: $price\n";
$price=null;
}
У меня есть структура для установки флагов для некоторых строк.Кроме того, когда в данных появляется новая строка, мой сценарий становится шумным, и я могу решить, имеет ли это значение.
(Примечание: установка $ price в null подразумевает в базе данных значение NULL, а не ноль.) * +1010 *