Почему str () изменяет вывод после очистки данных - PullRequest
0 голосов
/ 18 апреля 2020

При ознакомлении с данными, которые я поместил в df, я использую str и dim. Здесь str производит вид двух «секций» вывода, что очень похоже на то, что вы можете увидеть ниже.

После того, как я сделал некоторую очистку и снова запустил str (), он внезапно перестает возвращать вторую "раздел". Я учусь работать в R, и это меня озадачило.

Пожалуйста, если у вас есть какое-то объяснение, я буду благодарен.

Всего наилучшего, Андерс

> str(spain)
Classes ‘spec_tbl_df’, ‘tbl_df’, ‘tbl’ and 'data.frame':    76 obs. of  8 variables:
 $ SNo            : num  552 619 688 758 828 ...
 $ ObservationDate: chr  "02/01/2020" "02/02/2020" "02/03/2020" "02/04/2020" ...
 $ Province/State : chr  NA NA NA NA ...
 $ Country/Region : chr  "Spain" "Spain" "Spain" "Spain" ...
 $ Last Update    : chr  "2/1/2020 2:13" "2020-02-01T23:43:02" "2020-02-01T23:43:02" "2020-02-01T23:43:02" ...
 $ Confirmed      : num  1 1 1 1 1 1 1 1 2 2 ...
 $ Deaths         : num  0 0 0 0 0 0 0 0 0 0 ...
 $ Recovered      : num  0 0 0 0 0 0 0 0 0 0 ...
 - attr(*, "spec")=
  .. cols(
  ..   SNo = col_double(),
  ..   ObservationDate = col_character(),
  ..   `Province/State` = col_character(),
  ..   `Country/Region` = col_character(),
  ..   `Last Update` = col_character(),
  ..   Confirmed = col_double(),
  ..   Deaths = col_double(),
  ..   Recovered = col_double()
  .. )
> dim(spain)
[1] 76  8
> spain <-  spain[,-3] #Fjerner kolonne 3
> str(spain)
Classes ‘tbl_df’, ‘tbl’ and 'data.frame':   76 obs. of  7 variables:
 $ SNo            : num  552 619 688 758 828 ...
 $ ObservationDate: chr  "02/01/2020" "02/02/2020" "02/03/2020" "02/04/2020" ...
 $ Country/Region : chr  "Spain" "Spain" "Spain" "Spain" ...
 $ Last Update    : chr  "2/1/2020 2:13" "2020-02-01T23:43:02" "2020-02-01T23:43:02" "2020-02-01T23:43:02" ...
 $ Confirmed      : num  1 1 1 1 1 1 1 1 2 2 ...
 $ Deaths         : num  0 0 0 0 0 0 0 0 0 0 ...
 $ Recovered      : num  0 0 0 0 0 0 0 0 0 0 ...

1 Ответ

0 голосов
/ 18 апреля 2020

Я не уверен, как вы читаете ваши данные, но это ожидаемый результат после того, как вы задали подкадр данных подклассом spec_tbl_df.

Короткий ответ i sh таков: ваши данные имеют подкласс ‘spec_tbl_df’, когда они впервые импортируются в R. Этот подкласс имеет атрибут spec, который содержит информацию о типе данных столбцов. Когда вы вызываете str(), он показывает типы классов (‘tbl_df’, ‘tbl’ and 'data.frame' ...) и любые атрибуты (attr(*, "spec")). По замыслу, после того, как вы установите spec_tbl_df, этот атрибут будет удален. На практике это не влияет на ваш фрейм данных. Я бы подумал об этом как об артефакте загрузки ваших данных.

Вы можете прочитать об этом немного подробнее здесь: https://cran.r-project.org/web/packages/readr/news/news.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...