Привет всем разработчикам GCP,
Я новичок в продуктах GCP Data Engineering. Имея опыт работы с инструментом Microsoft SSIS ETL, я хотел бы узнать, какие различные преобразования и функции доступны в потоке данных Google,Инструмент MS SSIS обеспечивает простой интерфейс (перетаскивание) и использование SQL для выполнения ETL.
Поток данных в основном написан на Python, но как изменить или загрузить только определенные строки в CSV / текстовом файле, когда конкретныйзначение поля меньше требуемой суммы (фильтрация строк по одному полю)?
Поток данных Имя везде (онлайн), но почему нет документации по примерам обработки данных?
Если вы знаете какой-либо онлайн-курс (кроме Coursera) или книгу с практическим и практическим опытом, поделитесь им.
Спасибо