Пытаюсь извлечь данные из таблицы Redshift с помощью SQLAlchemy, но обнаружил, что документация трудна для моего варианта использования.
Код:
import dask.dataframe as dd
import pandas as pd
from sqlalchemy import create_engine
from sqlalchemy import Column, MetaData, Table
from sqlalchemy.sql import select
from getpass import getpass
import psycopg2
import missingno as msno
import dask.dataframe as dd
#PASSWORD INPUT PROMPT
pwd = getpass('password')
username = 'my.user'
password = pwd
server = 'some_host.redshift.amazonaws.com'
database = 'some_database'
port = '1234'
connection_string = f'postgresql+psycopg2://{username}:{password}@{server}:{port}/{database}'
engine = create_engine(connection_string)
metadata = MetaData()
t = Table('table_name', metadata,
Column('column_name', primary_key=True),
schema='my_schema')
df = dd.read_sql_table(t, connection_string, index_col='column_name', npartitions=50, columns=None)
Мои вопросы
- Как мне выполнить эквивалент
SELECT * WHERE foo_bar = 'foo'
- Мне действительно нужно указывать все имена столбцов в
't = '