Question

Я пытаюсь загрузить некоторые данные из Интернета для работы с Text Mining в R, но выполнить команду не удается.

Команды:

url <- 'http://www.gutenberg.org/cache/epub/100/pg100.txt' 
arquivo <- read.csv(url)

И ошибка:

Error in make.names(col.names, unique = TRUE) : 
  invalid multibyte string 1
In addition: Warning message:
In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls

Я попробовал несколько аргументов для функции read.csv(), но безуспешно.

Spacedman · Answer 1 · 28 сентября 2018

This:

Error in make.names(col.names, unique = TRUE) : 
  invalid multibyte string 1
In addition: Warning message:
In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls

сообщает вам, что в потоке есть нетекстовые данные.После проверки это кажется потоком в кодировке GZ, который веб-браузер будет декодировать на лету для представления простого текста.R может не захотеть этого делать.Вы можете получить текстовую версию с этого URL

> txt = readLines("http://www.gutenberg.org/files/100/100-0.txt")
> txt[14532]
[1] "ADRIANA. To fetch my poor distracted husband hence."
> txt[143532]
[1] "    He looks like sooth. He says he loves my daughter;"

TheDataGuy · Answer 2 · 28 сентября 2018

Это текстовый (.txt) документ из проекта Гутенберга.Используйте readLines

url <- 'http://www.gutenberg.org/cache/epub/100/pg100.txt' 
arquivo <- readLines(url)

Это работает для меня

Ошибка загрузки данных из интернета в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Ошибка загрузки данных из интернета в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов