Question

У меня есть два текстовых файла разного размера. Первый из них под example1.txt содержит только один столбец чисел:

И второй текстовый файл example2.txt имеет два столбца:

Первый столбец в примере1 .txt - это подмножество первого столбца в example2.txt. Номера второго столбца в example2.txt - это связанные значения с первым столбцом.

Что я хочу сделать, это получить связанный второй столбец example1.txt, следующий за example2.txt. Я пытался, но пока не мог понять. Буду признателен за любые предложения или решения в bash, awk

Поэтому результат будет:

Использование этого awk хорошо сработало для двух вышеуказанных текстовых файлов.

awk 'NR==FNR{a[$1]++; next} ($1 in a) && b[$1]++ < a[$1]' example1.txt example2.txt

ПРОБЛЕМА, с которой я столкнулся

Теперь я работаю в большом файле, следуя тем же командам awk. И из этого результата номера строк, которые я получаю, меньше чем example1.txt. Я не смог отладить проблему. Я думаю, иногда, когда в столбце example1 отсутствует какая-либо строка, они пропускаются.

ПРЕДЛОЖЕНИЕ ОБ ОБНОВЛЕНИИ от Эда Мортона:

Я пишу здесь предложение от Эда Мортиона, чтобы проверить, какой вывод мы получаем. Следуя команде awk, awk 'NR==FNR{a[$1]++; next} ($1 in a){print $1, a[$1]}' b.txt a.txt > c.txt Подсчитывает повторяющиеся общие числа в столбце 1 (из файла b.txt), а затем частота публикуется как столбец 2 из (a.txt) в выходном файле c. текст.

Если мы не используем a[$1]++, в приведенной выше команде awk мы получим outout c .txt:

awk 'NR==FNR{a[$1]; next} ($1 in a) && b[$1]++ < a[$1]' example1.txt example2.txt

RavinderSingh13 · Answer 1 · 09 апреля 2020

Не могли бы вы попробовать следующее.

awk '
FNR==NR{
  array[$1]=$2
  next
}
($1 in array){
  print $1,array[$1]
  found[$1]
}
END{
  print "Following are values present in example2 but not in example file"
  for(j in found){
     print j
  }
}
' file2 file1

Предложение для OP для кода OP: вы увеличиваете значение массива a с индексом первого поля, которое НЕ требуется, так как значение присутствует в самом его 2-м столбце

РЕДАКТИРОВАТЬ:

awk '
FNR==NR{
  array[$1]=$2
  next
}
($1 in array){
  print $1,array[$1]
  found[$1]
}
END{
  for(j in found){
     print j
  }
}
' file2 file1 | sort -n

Каждый раз, когда он начинает заполнять второй столбец, он всегда пропускает первый раз всегда. например:

ОБНОВЛЕНИЕ для @ RavinderSingh13

Пример взят из другого упомянутого большого текстового файла.

Соответствие столбцов в двух файлах [Особый случай, когда какой-либо элемент отсутствует?]

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Соответствие столбцов в двух файлах [Особый случай, когда какой-либо элемент отсутствует?]

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов