Я пытаюсь использовать awk
для фильтрации данных из файла. На данный момент для одного значения я использую команду, подобную приведенной ниже
hadoop fs -text file:///a/b/filename.snappy awk -F'|' '$11 == 655' > filter_20180705.txt
Я хочу передать список значений в разделе сравнения, вместо того, чтобы передавать $11 == 655
, я хотел бы передать список типа $11
IN (список). Любые мысли по этому поводу будут полезны
Sample-данные:
karthick,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,655,dev
kumar,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,611,dev
Raj,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,800,dev
John,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,823,dev
На данный момент я получаю результат как
karthick,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,655,dev
Мне нужно будет передать список в фильтре сравнения. Например, я хочу добавить 611
и 823
. Таким образом, ожидаемый результат будет
karthick,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,655,dev
kumar,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,611,dev
John,bangalore,software,it,bfsi,spark,hadoop,bigdata,etl,pentaho,823,dev