Я использую datamash
для оценки столбцов данных о ценах.Просматривая страницу man
, я не вижу четкого пути для решения следующих проблем:
The Viridian convict / by York, Sam, YORK B F 15.00 15.00
Show me a mountain / by Young, Kerry, YOUNG B F 27.00 27.00
Eve / by Young, William P. YOUNG B F 27.00 27.00
The gates of Evangeline / by Young, Hester. YOUNG B F 26.00 26.00
Meddling and murder / by Yu, Ovidia, YU B F
Vision of the future / by Zahn, Timothy. ZAHN B F 8.00 8.00
Star wars. by Zahn, Timothy, ZAHN B F
Wicked bite / by Zanetti, Rebecca, ZANETTI B F 15.00 15.00
Обратите внимание на пропущенные значения в 2 столбцах.Я не нашел способа заставить datamash
обрабатывать пропущенные значения без предварительной обработки с использованием других инструментов.
Пример.
awk -F'\t' '$6 != "" {print $6}' print.csv | datamash mean 1 sstdev 1 median 1
Опция --narm
казалась многообещающей, но непомочь на всех.Я получаю следующее:
datamash: недопустимое числовое значение в строке 1, поле 6: ''
Я могу продолжать использовать каналы, если это то, что нужно, но я 'Я новичок в этом инструменте и подозреваю, что есть более простой способ.