Есть несколько вариантов, но, на мой взгляд, лучше создать отдельные пути (папки) для каждого типа файлов и запустить Glue Crawler для каждого из них. У вас будет несколько таблиц, но вы можете объединить их, используя представления Athena, или вы можете преобразовать эти файлы в один формат, используя Glue (например).
Если вы хотите, чтобы файлы находились в одной папке, вы можете использовать шаблоны include и exclude в Glue Crawler. Также в этом случае вам придется создать отдельную таблицу для каждого типа файла.
https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html