все строки изменяются на NA после фильтрации R-данных - PullRequest
0 голосов
/ 06 июля 2018

У меня большой массив данных, состоящий из пяти столбцов.

Когда я пытаюсь отфильтровать один из столбцов другого столбца, каждая строка другого столбца изменяется на NA. Столбец, по которому я фильтрую, - VehicleEvent, Location - столбец, получающий замену NA.

str(datain)
'data.frame':   7551105 obs. of  19 variables:
 $ DiagnosticIDs   : chr  "2,0,3,1,774,775,810,744,951,947" "2,0,3,1,774,775,7,718,720,951,837,810,744,947" "2,0,3,1,774,775,7,810,744,951,947" NA ...
 $ DiagnosticValues: chr  "28.211,48284.435,31647,7650.75,0,0,0,1,1,-73" "28.272,48290.34,31650,7651.2,0,0,550,0,0,54,0,0,1,-81" "28.272,48290.34,31650,7651.2,0,0,550,0,1,1,-81" NA ...
 $ DriverName      : chr  "" "" "" NA ...
 $ IgnitionOn      : chr  "true" "true" "true" NA ...
 $ Latitude        : num  51.5 51.5 51.5 51.5 51.5 ...
 $ Longitude       : num  -0.462 -0.462 -0.463 -0.463 -0.463 ...
 $ Location        : chr  "" "Parking area" "Dispatch" NA ...
 $ Time            : num  1.52e+09 1.52e+09 1.52e+09 1.52e+09 1.52e+09 ...
     some columns not of interest omitted
 $ AlertId         : chr  NA NA NA "6fbc400e-1ae5-11e8-9eee-7845c4f0a3d7" ...
 $ AlertType       : chr  NA NA NA "Exited" ...
 $ VehicleEvent    : chr  NA NA NA "fabb4fcb-c254-4a13-8f9c-a3307a4ba63b" ...
 $ MessageType     : chr  NA NA NA "InsightAlertMessage" ...


str(datadf)
'data.frame':   104136 obs. of  6 variables:
$ Location    : chr  NA NA NA NA ...
$ Longitude   : num  -0.483 -0.462 -0.466 -0.464 -0.464 ...    
$ Latitude    : num  51.5 51.5 51.5 51.5 51.5 ...
$ AlertId     : chr  "ae22e47c-47c4-11e8-9513-7845c4f0a3d7" "3e13ccbc-47c6-11e8-a72e-7845c4f0a3d7" "5428da40-47c8-11e8-b59f-7845c4f0a3d7" "2fcd3fa8-47df-11e8-85a9-7845c4f0a3d7" ...
$ AlertType   : chr  "Exited" "Exited" "Exited" "Exited" ...
$ VehicleEvent: chr  "792d6964-6ba1-4f98-9b63-5c9e194fff6d" "792d6964-6ba1-4f98-9b63-5c9e194fff6d" "792d6964-6ba1-4f98-9b63-5c9e194fff6d" "792d6964-6ba1-4f98-9b63-5c9e194fff6d" ...

В данных нет символов, отличных от ACSII (все это извлекается из XML, если это что-то значит). Все запятые, завершающие пробелы, точка останова (точка) и слэши были удалены из Локации, если они это вызвали.

Столбцы были переименованы (на случай, если что-то еще происходит с теми же именами).

Я перепробовал все, что мог, включая ...

datadf <- datain %>%
    filter(AlertType == "Exited" &
           VehicleEvent == "792d6964-6ba1-4f98-9b63-5c9e194fff6d") %>%
            select(Location, Latitude, Longitude)

datadf <- datain[datain$VehicleEvent == "792d6964-6ba1-4f98-9b63-5c9e194fff6d",]

Последний изменяет все столбцы на «NA».

Являются ли данные в VehicleEvent настолько странными, что их невозможно обработать ... конечно, нет. У меня закончились идеи, и поэтому я прошу широкое сообщество.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...