Я попытался преобразовать столбец с именем As_of_Dt3, используя следующий код:
library(zoo)
data <- read.csv("C:/Users/user23/Documents/R_Output/data.csv", header = TRUE)
data$As_of_Dt <- as.character(data$As_of_Dt)
data$As_of_Dt <- trimws(data$As_of_Dt)
data$As_of_Dt2 <- as.Date(as.yearmon(BBG$As_of_Dt))
data$As_of_Dt3 <- format(as.Date(data$As_of_Dt2), "%m/%d/%y")
#This is to count the number of NAs in the column As_of_Dt3
sum(is.na(data$As_of_Dt3))
Несколько замечаний по поводу кода. Я хотел просмотреть каждый шаг в коде, когда просматривал его в Excel, чтобы устранить неполадки проблема. Вот почему As_of_Dt разделен на три разных столбца.
Здесь все возможные значения As_of_Dt:
"Feb 2017"
"March 2017"
"April 2017"
"May 2017"
"June 2017"
"July 2017"
"Aug 2017"
"Sept 2017"
"Oct 2017"
"Nov 2017"
"Dec 2017"
"Jan 2018"
"Feb 2018"
"March 2018"
"April 2018"
"May 2018"
"June 2018"
"July 2018"
"Aug 2018"
"Sept 2018"
"Oct 2018"
"Nov 2018"
"Dec 2018"
"Jan 2019"
"Feb 2019"
"March 2019"
"April 2019"
"May 2019"
"June 2019"
"July 2019"
"Aug 2019"
"Sept 2019"
"Oct 2019"
"Nov 2019"
"Dec 2019"
"Jan 2020"
"Feb 2020"
"August 2019"
Все NA имеют значение, когда As_of_Dt имеет значение «сентябрь 2017», «сентябрь 2018» или «сентябрь 2019»
как я могу предотвратить NA для вышеуказанных значений для As_of_Dt3? Мне также любопытно, почему это происходит, так как остальные значения для As_of_Dt3 не отличаются по формату исходного значения.