Можно ли заставить gnuplot игнорировать строку csv, в которой вместо номера указано «N / A»? - PullRequest
0 голосов
/ 25 января 2019

Я пытаюсь построить график рассеяния XY, используя gnuplot из большого набора данных, хранящегося в CSV. После некоторой настройки (включая замену разделителя на запятую) я запускаю команду plot '../foo.csv' using 4:8 with points, но на графике ничего не появляется. Несколько строк имеют «N / A» в столбце 4 вместо числа. Как gnuplot справляется с этим? Нужно ли специально указывать gnuplot игнорировать эти строки или я должен удалить их из csv перед использованием gnuplot? Может ли это быть причиной того, что данные не отображаются?

Пример данных в CSV ниже:

"","Car","Manufacturer","MPG","Cylinders","Displacement","Horsepower","Weight","Acceleration","Model.Year","Origin"
"5","torino","ford",17,8,302,140,3449,10.5,70,"American"
"6","galaxie 500","ford",15,8,429,198,4341,10,70,"American"
"13","torino (sw)","ford",NA,8,351,153,4034,11,70,"American"

1 Ответ

0 голосов
/ 25 января 2019

Jup, вы просто даете команду

 set datafile missing 'NA'

Однако в вашем примере набора данных есть только две действительные точки, поэтому автомасштабирование размещает их на границе, где вы их едва видите. plot ... w lp ps 4 чтобы лучше их видеть.

проверьте help set datafile missing о том, как gnuplot точно обрабатывает отсутствующие и недействительные точки данных (с примерами), и как можно изменить поведение.

...