Мне нужно объединить все txt-файлы в определенной папке на моем компьютере. Их сотни, и все они имеют разные имена, поэтому любой код, в котором вам приходилось вручную вводить имена файлов, чтобы объединить их, не работал для меня. Файлы находятся в кодировке UTF-8 и содержат смайлики и символы из разных языков (например, кириллицу), а также символы с акцентами и т. Д. (Например, é, ü, à ...). Один из пользователей stackoverflow-пользователя был так любезен, что дал мне следующий код для запуска в Powershell:
(gc *.txt) | out-file newfile.txt -encoding utf8
Он прекрасно работает для объединения файлов. Однако на самом деле он дает мне txt-файл с кодировкой "UTF-8 с BOM", а не с кодировкой "UTF-8". Кроме того, все смайлики и специальные символы были удалены и заменены на другие, такие как «¼» вместо «ü». Для того, что я делаю, очень важно, чтобы эти смайлики и специальные символы остались.
Может ли кто-нибудь помочь мне с настройкой этого кода (или предложением другого), чтобы он дал мне объединенный txt-файл с "UTF"-8 "-кодирование, которое все еще содержит все специальные символы? Пожалуйста, имейте в виду, что я мирянин.
Большое спасибо заранее за помощь и добрые пожелания!