R - для L oop через строки данных + запись длинного текста в файл - PullRequest
0 голосов
/ 14 апреля 2020

Я борюсь с частным для l oop в R. У меня есть фрейм данных с 52 строками и около 30 столбцами. Я пишу для l oop, чтобы извлечь данные (или значения) из каждой строки и вставить их в длинный текст - в данном случае код javascript / geo json. В настоящее время length () не примет ни одного аргумента, который я ввел в него.

Я новичок в R, поэтому большая часть этого кода может быть избыточной.

Код ниже:

# start of 'for loop' 
for(row in 1:nrow(intro_df)) { # trying to iterate through each row of the df
  lines <- vector(length()) # trying to deal with getting an error for "replacement has length zero" 
  # start of long text (notice placeholders in sprintf) --- javascript/geojson to be used in VS code later
  lines[row] <- sprintf(" 
{
            \"type\": \"Feature\",
            \"properties\": {
                \"huc8\": %s,
                \"Year\": %i,
                \"Total Water Use\": %f,
                \"Aquaculture\": %f,
                \"Commercial\": %f,
                \"Self-Supplied Domestic\": %f,
                \"Hydroelectric Power\": %f,
                \"Self-Supplied Industrial\": %f,
                \"Irrigation\": %f,
                \"Livestock\": %f,
                \"Mining\": %f,
                \"Public Supply\": %f,
                \"Thermoelectric\": %f,
                \"Total Groundwater\": %f,
                \"Total Surface Water\": %f
            },
            \"geometry\": {
                \"type\": \"Point\",
                \"coordinates\": [%f, %f]
            }
        }, \n", 
  intro_df$huc8[row], # column names where data/values from intro_df should be inserted into sprintf
  intro_df$Year[row], 
  intro_df$Total_WaterUse[row], 
  intro_df$Aquaculture[row], 
  intro_df$Commercial[row], 
  intro_df$Domestic[row], 
  intro_df$Hydroelectric_power[row], 
  intro_df$Industrial[row], 
  intro_df$Irrigation[row], 
  intro_df$Livestock[row], 
  intro_df$Mining[row], 
  intro_df$Public_Supply[row], 
  intro_df$Thermoelectric[row], 
  intro_df$Total_Groundwater[row], 
  intro_df$Total_Surface_Water[row], 
  intro_df$lat[row], 
  intro_df$long[row])

}
all_lines <- paste(lines, collapse = "\n") # store lines to variable all_lines

file_js_points <- file("js_points.txt") # write all_lines to a text file 
writeLines(all_lines, file_js_points)
close(file_js_points)

РЕДАКТИРОВАТЬ Я исправил свой код, чтобы избавиться от 'для l oop'. Ниже приведен код, который работал на меня:

# Input data from each row of intro_df into placeholders in sprintf()
lines <- sprintf(" 
{ 
            \"type\": \"Feature\",
            \"properties\": {
                \"huc8\": %s, 
                \"Year\": %s,
                \"Total Water Use\": %s,
                \"Aquaculture\": %s,
                \"Commercial\": %s, 
                \"Self-Supplied Domestic\": %s,
                \"Hydroelectric Power\": %s,
                \"Self-Supplied Industrial\": %s,
                \"Irrigation\": %s, 
                \"Livestock\": %s, 
                \"Mining\": %s, 
                \"Public Supply\": %s, 
                \"Thermoelectric\": %s, 
                \"Total Groundwater\": %s, 
                \"Total Surface Water\": %s 
            }, 
            \"geometry\": { 
                \"type\": \"Point\", 
                \"coordinates\": [%s, %s] 
            } 
        }, \n", 
                      intro_df$huc8, # column names where data/values from intro_df should be inserted into sprintf
                      intro_df$Year, 
                      intro_df$Total_WaterUse, 
                      intro_df$Aquaculture, 
                      intro_df$Commercial, 
                      intro_df$Domestic, 
                      intro_df$Hydroelectric_power, 
                      intro_df$Industrial, 
                      intro_df$Irrigation, 
                      intro_df$Livestock, 
                      intro_df$Mining, 
                      intro_df$Public_Supply, 
                      intro_df$Thermoelectric, 
                      intro_df$Total_Groundwater, 
                      intro_df$Total_Surface_Water, 
                      intro_df$lat, 
                      intro_df$long)

# Collapse all rows into one variable separated by new line 
js_points <- paste(lines, collapse = "\n") 

# Create js_point text file for all js_points
sink(file = "js_points.txt")
cat(js_points)
sink()

1 Ответ

1 голос
/ 14 апреля 2020

Проблема в том, что вы сбрасываете lines, чтобы быть пустым в начале каждой итерации l oop. Вы должны инициализировать его (желательно с правильной длиной, а не с 0 длиной) до l oop. И вам нужно использовать аргумент length =, а не функцию length(). (Я также использую character, так что это правильный тип вектора.)

lines = character(length = nrow(intro_df))
for(row in 1:nrow(intro_df)) { 
  lines[row] <- ...
}

Однако , sprintf векторизовано, поэтому вам не нужно for l oop вообще. Я использую with(), чтобы избежать многократного ввода имени фрейма данных.

lines <- with(intro_df, sprintf("
  {...

  }",
  huc8,
  Year,
  Total_WaterUse, ...
))

all_lines <- paste(lines, collapse = "\n") # store lines to variable all_lines

file_js_points <- file("js_points.txt") # write all_lines to a text file 
writeLines(all_lines, file_js_points)
close(file_js_points)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...