Сводка по фрейму данных показывает мне основные значения для символьного поля.Когда я применяю к нему подстроку: вместо этого я получаю «бесполезную» информацию - PullRequest
0 голосов
/ 25 октября 2018

Я новичок в R языке.

Я загрузил лист Excel в кадр данных.В сводке покажите мне эту информацию:

summary(dat)

      APE                                                          LIBELLE       EFFECTIF  
 8110Z  :638   Activités combinées de soutien lié aux bâtiments        :638   1,5    :664  
 2370Z  :  8   Commerce de gros de bois et de matériaux de construction:  8   4      : 57  
 4511Z  :  8   Commerce de voitures et de véhicules automobiles légers :  8   34,5   : 37  
 4673A  :  8   Hôtels et hébergement similaire                         :  8   14,5   : 36  
 5510Z  :  8   Taille, façonnage et finissage de pierres               :  8   7,5    : 24  
 2363Z  :  6   Fabrication de béton prêt à l'emploi                    :  6   74,5   : 17  
 (Other):181   (Other)                                                 :181   (Other): 22 

Код APE (который, я думаю, теперь является европейским кодом NACE, но поле имеет старое имя) слишком подробный и состоит из пяти символов.Я выполняю это утверждение, чтобы принять во внимание только два первых символа:

dat$APE <- substr(dat$APE, 1, 2)

Затем команда summary не показывает ожидаемый результат:

summary(dat)

 APE                                                                LIBELLE       EFFECTIF  
 Length:857         Activités combinées de soutien lié aux bâtiments        :638   1,5    :664  
 Class :character   Commerce de gros de bois et de matériaux de construction:  8   4      : 57  
 Mode  :character   Commerce de voitures et de véhicules automobiles légers :  8   34,5   : 37  
                    Hôtels et hébergement similaire                         :  8   14,5   : 36  
                    Taille, façonnage et finissage de pierres               :  8   7,5    : 24  
                    Fabrication de béton prêt à l'emploi                    :  6   74,5   : 17  
                    (Other)                                                 :181   (Other): 22  

Iожидал 23, 45, 46, 55, 81 ... в столбце APE.

Я не понимаю, откуда может возникнуть проблема, так как, когда я выполняю команду head, все выглядит нормально.

head(dat)

  APE                                                           LIBELLE EFFECTIF
1  02                                           Exploitation forestière        4
2  08 Extraction pierres ornement. construc. calcaire industriel, gypse     14,5
3  08        Exploit gravieres & sablieres, extraction argiles & kaolin     34,5
4  10             Préparation industrielle de produits à base de viande        4
5  10             Préparation industrielle de produits à base de viande      7,5
6  10                          Transformation et conservation de fruits     34,5

С уважением,

1 Ответ

0 голосов
/ 07 сентября 2019

@ Роланд, спасибо за ваш хороший ответ.

dat$APE <- as.factor(substr(dat$APE, 1, 2))

удалось преобразовать строку в множитель, исправив мою проблему.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...