Мне нужно решение для масштабируемой базы данных, которое может масштабироваться до нескольких рабочих узлов, и я столкнулся с Apache Spark SQL, который кажется очень мощным и устойчивым. Могу ли я использовать это как замену Mysql? Я пытался создавать, читать, обновлять, удалять значения из DataFrame, но кажется, что он не был создан для этой цели? Я (в настоящее время) не могу найти способ обновления и строк ... Это похоже на то, что это действительно хорошо для запроса данных, когда они у вас есть, но не для вставки данных
Я ошибаюсь? Я чрезвычайно новичок в Spark и не хочу тратить время на попытки превратить его во что-то, что не
В случае, если его нельзя использовать в качестве базы данных ... это означает, что Spark просто используется для аналитики? Должен ли я хранить свои данные с использованием базы данных, а затем загружать набор данных в spark, если мне нужна информация в реальном времени?