Если вы просто хотите использовать стандартную библиотеку, которую вы используете, вы можете использовать msvcrt, чтобы получить текущее нажатие клавиши и сопоставить его с частотой.
import msvcrt
import time
import winsound
notes = {'a': 440, 's': 935, 'd': 1039}
while True:
key = msvcrt.getch()
try:
note = notes[key]
except KeyError:
note = 0
winsound.Beep(note, 10)
time.sleep(0.01)