Назначить номер позиции для символов в R - PullRequest
0 голосов
/ 05 июня 2018

У меня есть файл, который содержит 10 ^ 3 символов.Мой файл выглядит так:

ATTGC
CTGGC
TTTGC
GCTCT

Мне нужен файл, в котором все эти символы расположены в строке следующим образом:

1 A
2 T
3 T
4 G
5 C
6 C
7 T

до конца.Я попытался с помощью командной строки vi, но не получил результат для большого файла.Возможно ли это в R.

Ответы [ 2 ]

0 голосов
/ 05 июня 2018
# create input file
cat("ATTGC
CTGGC
TTTGC
GCTCT",file="test.txt")

# check input
file.edit("test.txt")

# read
txt <- scan(file="test.txt",what=character())
# [1] "ATTGC" "CTGGC" "TTTGC" "GCTCT"

# build output
df <- data.frame(X =unlist(strsplit(txt,"")))
#    X
# 1  A
# 2  T
# 3  T
# 4  G
# 5  C
# 6  C

# write output
write.table(df,"test2.txt",quote = FALSE,col.names = FALSE)

# check result
file.edit("test2.txt")

# clean up
unlink(c("test.txt","test2.txt"))
0 голосов
/ 05 июня 2018

При условии, что ваши входные данные хранятся как input.txt

# Read data into R
input <- read.delim('input.txt', header = FALSE, stringsAsFactors = FALSE)[,1]

# Split each element into single characters and combine
output <- unlist(strsplit(x = input, split = ''))

# Export data
write.table(x = output, file = 'output.csv', sep = ',', col.names = FALSE)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...