Не могли бы вы попробовать следующее (учитывая, что OP не имеет инструментов xml и не может их установить).
IFS=',';array=( $(
awk '
BEGIN{ OFS="," }
/<subject lb="/{
match($0,/".*"/)
val=(val?val OFS:"")substr($0,RSTART+1,RLENGTH-2)
}
END{
print val
}' Input_file))
Для печати всех элементов массива используйте:
echo ${array[@]}
Fall Sem 2020 Spring Sem 2020 Fall Sem 2021 Spring Sem 2021
Для печати указанного c элемента используйте:
echo ${array[0]}
Fall Sem 2020