Я гуглил и не могу найти ответ на свой вопрос. Допустим, у меня есть 2 большие таблицы, и моя...
Давайте рассмотрим такой фрагмент псевдокода Python, используя spark. rdd1 = sc.textFile("..
Я запускаю scala_script.scala из unix cli и получаю ошибку: enycription key missing, в то время как...
У меня есть HTTP-запрос, который я использую для получения всех клиентов между 1.5.2018 и 7.5.2018....
Для проекта мне нужно извлечь данные из разных источников. Одним из таких источников является...
Почему Riak TS считается базой данных NoSQL, когда ей требуется предварительно определенная схема...
Подключение GSheet к Big Query - простая и очень интересная функция, но очень медленная. Кажется,...
В настоящее время я использую SQL Server и у меня возникли проблемы, у меня есть таблица адресов с...
Если мне просто нужно 2/3 столбца и я запрашиваю SELECT * вместо предоставления этих столбцов в...
Мне нужно хранить сигналы, поступающие от миллионов устройств каждую 1 минуту, где каждый объект...
У меня есть GraphQL + - запрос, в котором я хочу найти общих друзей двух человек. Но я...
Я заранее прошу прощения, задавая этот вопрос. Это должно быть что-то очень глупое, что я пропускаю
Я ищу предложения по использованию распределенной системы для обработки этих данных. У меня есть...
Я прочитал эту статью . В нем говорится, что Neo4j может масштабироваться горизонтально, но только...
Я хочу знать, как параллелизм запросов реализован в apache ignite. Полученные числа полностью...
У меня есть база данных Postgresql с более чем 100 миллиардами строк в одной таблице. Схема таблицы...
Что такое концепция «параллельных коллекций» в Spark, и как эта концепция может улучшить общую...
У меня есть два txt-файла, содержащие данные Json, доступные в системе Linux. Я создал...
Как скопировать из локального кластера hadoop в удаленный общий ресурс NFS или SMB, используя...
Когда я захотел сделать проект по анализу настроений, я много раз искал в Интернете, и, наконец, я...
Я использую cassandra db с миллиардами записей и хочу хранить данные, сгруппированные по дате....
Я использую Ignite для приложения, работающего практически в реальном времени, и хочу повысить...
Я использовал этот Python-код k-means ++ для инициализации k центров, но он очень длинный для...
Я работаю в энергетической компании. В настоящее время мы генерируем 1 ГБ данных в виде плоских...
Мне задали этот вопрос в интервью, и я не уверен, дал ли я правильный ответ, поэтому мне хотелось...