Кажется, что вы неправильно используете набор данных, этот один более уместен.
df = pd.read_csv('GaltonFamilies.csv')
data = df.loc[(df['gender'] == 'male')&(df['childNum'] == 1)]
father_height = data['father']
child_height = data['childHeight']
plt.grid(True)
plt.scatter(father_height, child_height, c='k', alpha = .5)
создает этот график.