Тайм-аут запроса соответствия строк в BIGQUERY - PullRequest
0 голосов
/ 03 ноября 2019

У меня есть оператор выбора:

select
    M.FA_Unique_Listing_Identifier_Ref_ID
    ,P.ATTOM_ID
    ,P.ParcelNumberRaw Parcel
    ,M.Assessors_Parcel_Identification_Number
    ,M.Listing_Tracking_ID
    ,P.CensusTract GEOID
    ,M.Current_Original_Listing_Date
    ,M.Add_Change_Delete_Indicator
    ,M.FA_Calculated_Days_on_Market
    ,M.Status
    ,M.Status_Sub_Type
    ,M.Update_Timestamp
    ,M.LoadDate
    ,'Parcel Match' as Match_Type
from `mother-stg-254212.DATATREE_MLS.MLS_STAGE` M  
JOIN `mother-216719.PROPERTY.PROPERTY_DETAIL` P on
M.Property_Address = P.PropertyAddressFull
and M.Property_Zip = P.PRopertyAddressZIP

, но время ожидания этого запроса истекло. Два соответствующих поля Address и Zip являются строками. Время работы 6 часов.

Как я могу сделать это быстрее?
Спасибо

1 Ответ

1 голос
/ 04 ноября 2019

Это похоже на сценарий несбалансированные объединения .

Для этого вы можете либо попытаться оптимизировать шаблоны соединения . Если проблема не устраняется после этого, я предлагаю открыть средство отслеживания проблем , чтобы команда разработчиков BigQuery могла проверить это поведение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...