Использование R для разделения TXT-файлов на основе фиксированной ширины - PullRequest
0 голосов
/ 06 июля 2018

Я использую read_fwf в Package readr для разделения столбцов в текстовом файле.

Код прост и похож на:

   fwf_widths(c(4,9,3,1,24,17,1

Однако существует проблема при преобразовании чисел, подобных 01412, - в Excel (CSV) он станет 1412 напрямую --- (потому что у меня много кодов, таких как 001, 0001, тогда все становится 1

Как я могу решить эту проблему?

1 Ответ

0 голосов
/ 06 июля 2018

Мы можем прочитать файл с помощью readLines и затем использовать read.table

lines <- readLines('yourfile.csv')
read.table(text = gsub(" ([A-Z]\\w+\\s+?[A-Za-z]+?) ", " '\\1' ", lines),
  sep = " ", header = FALSE,
     colClasses = rep("character", 7), stringsAsFactors = FALSE)
#        V1 V2    V3              V4   V5      V6   V7
#1 2016SVIC NN 01407 MOUNT ALEXANDER 7-12 COLLEGE 3031
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...