Проблемы с форматированием данных и их правильной работой - PullRequest
0 голосов
/ 21 апреля 2020

Я получаю сообщения об ошибках, пытаясь найти сводную статистику для моих переменных в моих наборах данных:

**Error in UseMethod("filter_") : no applicable method for 'filter_' applied to an object of class "character"

$ operator is invalid for atomic vectors

Error in UseMethod("tbl_vars") : no applicable method for 'tbl_vars' applied to an object of class "character"**

И говорить больше о втором сообщении об ошибке, когда я пытаюсь используйте "[" вместо символа доллара, чтобы попытаться сделать его числовым значением c, я получаю сообщения об ошибках:

Error in "2007"["Total Actual Costs"] <- as.numeric("2007"["Total Actual Cost"]) : 
  target of assignment expands to non-language object

и

Error in "2007"[["Total Actual Cost"]] : subscript out of bounds.

Я принципиально не понимаю, в чем дело, я использовал как файл Excel, так и файл CSV. Я попытался изменить тип значения данных на числовой в Excel для них обоих. И я не думаю, что размер набора данных является проблемой, потому что я использовал больше, и я также использовал гораздо больше неаккуратных данных, поэтому я не думаю, что это тоже проблема. Я приложил весь свой код ниже

В основном я пытаюсь найти способ преобразовать переменные в числовой формат и отфильтровать данные по коду FIPS, чтобы у меня был набор для штатов и округов для эти годы.

https://drive.google.com/open?id=1y7ISVmOKi1cWRcKNgKF7VYYNDEn0F8B1 ссылка на мои данные

 ```

library(tidyselect)
library(openintro)
library(GGally)
library(dplyr)
library(e1071)
library(plotrix)
library(fastDummies)
library(ggplot2)
library(readxl)
library(tidyverse)

    '2007' <-read_xlsx("Medicare county 2007.xlsx", skip = 1)
    `2007` <- replace(`2007`,`2007` == "*",NA)
    '2008' <-read_xlsx("Medicare county 2008.xlsx", skip = 1)
    `2008` <- replace(`2008`,`2008` == "*",NA)
    '2009' <-read_xlsx("Medicare county 2009.xlsx", skip = 1)
    `2009` <- replace(`2009`,`2009` == "*",NA)
    '2010' <-read_xlsx("Medicare county 2010.xlsx", skip = 1)
    `2010` <- replace(`2010`,`2010` == "*",NA)
    '2011' <-read_xlsx("Medicare county 2011.xlsx", skip = 1)
    `2011` <- replace(`2011`,`2011` == "*",NA)
    '2012' <-read_xlsx("Medicare county 2012.xlsx", skip = 1)
    `2012` <- replace(`2012`,`2012` == "*",NA)
    '2013' <-read_xlsx("Medicare county 2013.xlsx", skip = 1)
    `2013` <- replace(`2013`,`2013` == "*",NA)
    '2014' <-read_xlsx("Medicare county 2014.xlsx", skip = 1)
    `2014` <- replace(`2014`,`2014` == "*",NA)
    '2015' <-read_xlsx("Medicare county 2015.xlsx", skip = 1)
    `2015` <- replace(`2015`,`2015` == "*",NA)
    '2016' <-read_xlsx("Medicare county 2016.xlsx", skip = 1)
    `2016` <- replace(`2016`,`2016` == "*",NA)
    '2017' <-read_xlsx("Medicare county 2017.xlsx", skip = 1)
    `2017` <- replace(`2017`,`2017` == "*",NA)

    '07state'<- filter(.data='2007','State and County FIPS Code',na.rm==TRUE)
    ```
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...