R числовой к символьной потере точности - PullRequest
0 голосов
/ 13 ноября 2018

Я хочу преобразовать мой многозначный числовой вектор в символ.Я попробовал следующие решения здесь , который работает для одного числа, но не для вектора.Это нормально

options(digits=20)
options(scipen=99999)
x<-129483.19999999999709;format(round(x, 12), nsmall = 12)
[1] "129483.199999999997"

Но это не так.как сохранить числовую точность в символах для числовых векторов?

> y <- c(129483.19999999999709, 1.3546746874,687676846.2546746464)

Особенно проблематично это 687676846.2546746464 Также пытались:

> specify_decimal(y, 12)
[1] "129483.199999999997"    "1.354674687400"         "687676846.254674673080"
> formatC(y, digits = 12, format = "f")
[1] "129483.199999999997"    "1.354674687400"         "687676846.254674673080"
> formattable(y, digits = 12, format = "f")
[1] 129483.199999999997    1.354674687400         687676846.254674673080
> sprintf(y, fmt='%#.12g')
[1] "129483.200000" "1.35467468740" "687676846.255"
> sprintf(y, fmt='%#.22g')
[1] "129483.1999999999970896" "1.354674687399999966075" "687676846.2546746730804"

Ожидаемый результат:

[1] "129483.199999999997" "1.354674687400" "687676846.254674646400"

Кажется, что потеря точности происходит только один раз, она не повторяется.

> require(dplyr)
> convert <- function(x) as.numeric(as.character(x))
> 687676846.2546746464 %>% convert
[1] 687676846.25467503
> 687676846.2546746464 %>% convert %>% convert %>% convert
[1] 687676846.25467503

Здесь у меня только 5-значная точность, но более проблематично, я не могу заранее знать, какую точность я собираюсь получить ..

1 Ответ

0 голосов
/ 14 ноября 2018

В конце я мог делать то, что хотел, используя эти функции. addtrailingzeroes добавит число нулей после десятичного числа к x.

nbdec <- function(x) {
  x1 <- as.character(x)
  xsplit <- strsplit(x1,"\\.")
  xlength <- sapply(xsplit, function(d) nchar(d)[2])
  xlength <- ifelse(is.na(xlength), 0, xlength)
  return(xlength)
}

trailingzeroes <- function(x, dig) {
  res <- rep(NA, length(x))
  for( i in 1:length(x)) {
    if(!is.na(x[i])) res[i] <- { paste0(rep(0,max(0,dig-nbdec(x[i]))), collapse="") }
    else { res[i] <- ""}
    }
return(res)
}

trailingcommas <- function(x) ifelse(is.na(x), NA, ifelse(nbdec(x)==0, ".",""))

addtrailingzeroes <- function(x, digits) {
  return(ifelse(!is.na(x), paste0(x, trailingcommas(x), trailingzeroes(x, digits)),NA))
}

Однако, чтобы подавить неточности и ошибки округления, сначала необходимо обрезать x, используя roundnumerics.max:

roundnumerics.max <- function(df, startdig=12) {
  for(icol in 1:ncol(df)) {
    if( is.numeric(df[,icol])) {
      dig <- startdig
      while(any(!as.numeric(as.character(df[,icol])) %==% df[,icol])) {
        dig <- dig-1
        df[,icol] <- round(df[,icol], digits=dig)
        if(dig==0) {
          break
          pprint("ERROR: zero numeric accuracy")
        }
      } 
      pprint("Numeric accuracy for column ",icol," ", colnames(df)[icol], " is ", dig)
    }
  }
  return(data.frame(df, stringsAsFactors = F))
}

Это медленно и далеко не элегантно ... Я все еще думаю, что трудно поверить, что R имеет такое ограничение точности до 16 значащих цифр, и добавляет неточный шум, который вызывает расхождения при попытке увеличить опция digits ... Без оповещения ...

...