У меня есть несколько таблиц, разделенных табуляцией в формате txt с большим количеством столбцов. Первое, что мне было нужно, это выбрать один столбец и извлечь все значения с его точностью в этом столбце и файле местоположения. Итак, у меня есть новый файл с 3 столбцами.
Сейчас я пытаюсь добавить дополнительные столбцы из других файлов.
Пример:
file1.txt
Column1 Column2 Column3... ColumnN
one green C
two orange V
three red C
five white C
file2.txt
Column1 Column2 Column3... ColumnN
one green C
four blue C
three red C
five white C
Вот новый файл, который у меня есть:
fileCombined.txt
Column2 Frecuency Location
green 2 file1, file2
orange 1 file1
red 2 file1, file2
white 2 file1, file2
blue 1 file2
И нужный новый вывод:
Column2 Frecuency Location Column1 Column3
green 2 file1, file2 one C
orange 1 file1 two V
red 2 file1, file2 three C
white 2 file1, file2 five C
blue 1 file2 four C
Это пример, потому что мои данные больше (я использую данные geneti c), но я думаю, что они масштабируемы.
Я пытаюсь использовать функцию leftjoin или merge, но она не работает так, как мне хотелось бы ... Код, который я использую, очень прост, сначала я читаю кадры данных:
> mydata1 = read.delim('file1.txt', header=T)
> mydata2 = read.delim('fileCombined.txt', header=T)
И это следует за слиянием :
myfulldata = merge(mydata1, mydata2)
write.table(myfulldata, file = "myfulldata.txt", row.names = FALSE, sep = "\t")
но он дает мне таблицу со всеми столбцами (мне все равно, но он удаляет все строки, которые не совпадают) Любая помощь приветствуется! спасибо !!