Вы можете использовать arrow
для этого (то же самое, что и в Python pyarrow
), но в настоящее время это также поставляется в комплекте с R (без использования Python). Поскольку он еще не доступен в CRAN, сначала вам нужно вручную установить Arrow C ++:
git clone https://github.com/apache/arrow.git
cd arrow/cpp && mkdir release && cd release
# It is important to statically link to boost libraries
cmake .. -DARROW_PARQUET=ON -DCMAKE_BUILD_TYPE=Release -DARROW_BOOST_USE_SHARED:BOOL=Off
make install
Затем вы можете установить пакет R arrow
:
devtools::install_github("apache/arrow/r")
И использовать его для загрузки файла Parquet
library(arrow)
#>
#> Attaching package: 'arrow'
#> The following object is masked from 'package:utils':
#>
#> timestamp
#> The following objects are masked from 'package:base':
#>
#> array, table
read_parquet("somefile.parquet", as_tibble = TRUE)
#> # A tibble: 10 x 2
#> x y
#> <int> <dbl>
#> …