Как вы знаете, read.table
в R
- очень полезная, но медленная функция, особенно когда дело касается чтения больших баз данных. Для решения проблем, связанных с этой функцией, существуют такие функции, как read_table
и fread
из пакетов readr
и data.table
. К сожалению, их аргументы отличаются от read.table
, что затруднило мне повторение этого примера:
download.file("https://datasets.imdbws.com/title.basics.tsv.gz", "mov_title")
download.file("https://datasets.imdbws.com/title.ratings.tsv.gz", "mov_rating")
title <- read.table("mov_title", sep="\t", header=TRUE,
fill=TRUE, na.strings="\\N", quote="")
rating <- read.table("mov_rating", sep="\t", header=TRUE,
fill=TRUE, na.strings="\\N", quote="")
В основном я хочу использовать fread
или read_table
(или оба, если это возможно), чтобы создать мой " Титульные и рейтинговые базы данных. Любые советы или рекомендации будут высоко оценены.