При попытке загрузить csv в таблицу cassandra я получил странную ошибку (см. Ниже). Я попытался изменить параметры COPY, такие как CHUNKSIZE (30-100) и NUMPROCESSES (2-4), но он изменил только строку, в которой нагрузка зависает (может зависнуть в 49907, 49897 и т. Д. c). Я не понимаю, почему так, файл в порядке ссылка здесь (50000 строк).
Журнал ошибок:
Мой код:
create keyspace hw1 with replication = {'class' : 'SimpleStrategy', 'replication_factor':1};
CREATE TABLE hw1.product_reviews
(
product_id text,
review_id text,
review_headline text,
review_body text,
review_date date,
star_rating int,
PRIMARY KEY (product_id, review_id)
);
COPY hw1.product_reviews (product_id, review_id, review_headline, review_body, review_date, star_rating) from 'product_reviews.csv' with DELIMITER='\t' AND HEADER=TRUE;
Я использую Ubuntu 16.04 и cql sh 5.0.1.