R пакетная обработка текстовых файлов - PullRequest
0 голосов
/ 06 июня 2018

Я новичок в R и хочу выполнить пакетную обработку всех файлов в рабочем каталоге.У меня много файлов .txt, и я хочу их прочитать, рассчитать частоту одного столбца, рассчитать процент и так называемый «H-счет», вычислить сумму H-показателя и сохранить ее в векторе.Затем должен быть обработан следующий файл .txt и т. Д.

После обработки всех файлов я хочу записать вектор в другом файле .txt.Окончательный файл .txt также должен содержать имя входного файла и рассчитанную сумму H-Score.Это то, что я имею до сих пор, но, как вы можете видеть, я абсолютный новичок в программировании и R ...

setwd("~/Desktop/Automated Analysis/TXT/") # Set working directory

 # List all txt files including sub-folders
list_of_files <- list.files(path = ".", recursive = TRUE,
                           pattern = "\\.txt$", full.names = TRUE)

library(data.table)

# Read all the files and create a FileName column to store filenames
DT <- rbindlist( sapply(list_of_files, fread, simplify = FALSE),
                        use.names = TRUE, idcol = "FileName" )

br = c(0,1,3,9,15,500) # Set breaks
bins = c(0,1,2,3,4) # Set bins

for (k in 1:length(list_of_files)) { # process all the files in the working directory
  HScore_list = c() # create a vector for storing the results
  for(i in 1:5) { my_vector = c(HScore_list,i) }
  freq = hist(Count, breaks=br, plot=FALSE) 
  df = data.frame(bins, frequency=freq$counts,
          df$percent=df$frequency / sum(df$frequency) * 100,
          df$HScore=df$percent * df$bins)
  HScore = sum(df$HScore)
}
write(HScore_list, "HScore_list.txt", sep="\n")

Знаете ли вы, что я хочу, и можете мне помочь?

РЕДАКТИРОВАТЬ: Моя проблема в том, что код не производит вывод.

...