Как я могу отсортировать эти данные? - PullRequest
0 голосов
/ 14 июля 2011

http://img32.imageshack.us/img32/6649/workspace1001.png большая версия

У меня есть данные этого продукта в CSV-файле, но некоторые поля неверны. Посмотрите на скриншот. Некоторые изображения похожи на это: image.jpg # Foobar

Когда они должны быть image.jpg

Не у всех есть это. Они все .jpg

Что я могу сделать в Sed или Python / Perl, чтобы это исправить?

Ответы [ 2 ]

3 голосов
/ 14 июля 2011
sed -i.bk -e 's/jpg#[^,]*/jpg/g' filename
0 голосов
/ 14 июля 2011

Итак, все, что вы хотите сделать, это убрать # ... из столбца S, столбец изображений, верно?

Perl может сделать это аккуратно.Обрабатывает кавычки в CSV и обновляет только те столбцы, которые вы указали.

my $in = IO::File->new( "<old.csv" );
my $out = IO::File->new( ">new.csv" );
my $csv = Text::CSV_XS->new();
while( my $rec = $csv->getline($fh) )
{
    $rec->[18] =~ s/\#.*$//s;
    $csv->print( $row );
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...