Объединить несколько файлов TXT с разделителями табуляцией по состоянию столбца одного файла - PullRequest
0 голосов
/ 06 февраля 2020

У меня есть несколько таблиц, разделенных табуляцией в формате txt с большим количеством столбцов. Первое, что мне было нужно, это выбрать один столбец и извлечь все значения с его точностью в этом столбце и файле местоположения. Итак, у меня есть новый файл с 3 столбцами.

Сейчас я пытаюсь добавить дополнительные столбцы из других файлов.

Пример:

file1.txt

Column1 Column2 Column3... ColumnN
one     green   C
two     orange  V
three   red     C
five    white   C

file2.txt

Column1 Column2 Column3... ColumnN
one     green   C
four    blue    C
three   red     C
five    white   C

Вот новый файл, который у меня есть:

fileCombined.txt

Column2 Frecuency Location
green   2         file1, file2
orange  1         file1
red     2         file1, file2
white   2         file1, file2
blue    1         file2

И нужный новый вывод:

Column2 Frecuency Location     Column1 Column3
green   2         file1, file2 one     C
orange  1         file1        two     V
red     2         file1, file2 three   C
white   2         file1, file2 five    C
blue    1         file2        four    C

Это пример, потому что мои данные больше (я использую данные geneti c), но я думаю, что они масштабируемы.

Я пытаюсь использовать функцию leftjoin или merge, но она не работает так, как мне хотелось бы ... Код, который я использую, очень прост, сначала я читаю кадры данных:

> mydata1 = read.delim('file1.txt', header=T)
> mydata2 = read.delim('fileCombined.txt', header=T)

И это следует за слиянием :

myfulldata = merge(mydata1, mydata2)
write.table(myfulldata, file = "myfulldata.txt", row.names = FALSE, sep = "\t")

но он дает мне таблицу со всеми столбцами (мне все равно, но он удаляет все строки, которые не совпадают) Любая помощь приветствуется! спасибо !!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...