Из моего собственного исследования я понимаю основную идею c, лежащую в основе алгоритмов объединения SQL в одной базе данных (нераспределенной) - например. ha sh объединение, объединение объединением, l oop объединение. Являются ли алгоритмы распределенного объединения похожими на алгоритмы в нераспределенной базе данных?
Например, если у меня есть таблица Users с атрибутами: - User_id - Age
И у меня есть таблица Comments с атрибутами: - User_id - Comment_id - Comment
Предположим, что распределенная база данных использует User_id для шардинга таблицы Users и использует Comment_id для шардинга таблицы Comments.
Так что же на самом деле происходит, когда вы вызвать SQL запрос:
SELECT * FROM Users INNER JOIN Comments ON Users.User_id = Comments.User_id
? Таблица пользователей и таблица комментариев сопоставляются на одном компьютере, а затем выполняется соединение? Или есть какой-то способ, которым вы можете создать JOIN, даже если он распространяется?