Как записать файл в формате UTF-8? - PullRequest
44 голосов
/ 30 января 2011

У меня есть куча файлов, которые не в кодировке UTF-8, и я конвертирую сайт в кодировку UTF-8.

Я использую простой скрипт для файлов, которые хочу сохранить в utf-8, но файлы сохраняются в старой кодировке:

header('Content-type: text/html; charset=utf-8');
mb_internal_encoding('UTF-8');
$fpath="folder";
$d=dir($fpath);
while (False !== ($a = $d->read()))
 {

 if ($a != '.' and $a != '..')
  {

  $npath=$fpath.'/'.$a;

  $data=file_get_contents($npath);

  file_put_contents('tempfolder/'.$a, $data);

  }

 }

Как сохранить файлы в кодировке utf-8?

Ответы [ 10 ]

68 голосов
/ 28 января 2012

Добавить спецификацию: UTF-8

file_put_contents($myFile, "\xEF\xBB\xBF".  $content); 
43 голосов
/ 30 января 2011

file_get_contents / file_put_contents не будет магически преобразовывать кодировку.

Вы должны преобразовать строку явно; например, с iconv() или mb_convert_encoding().

Попробуйте это:

$data = file_get_contents($npath);
$data = mb_convert_encoding($data, 'UTF-8', 'OLD-ENCODING');
file_put_contents('tempfolder/'.$a, $data);

Или же, с помощью потоковых фильтров PHP:

$fd = fopen($file, 'r');
stream_filter_append($fd, 'convert.iconv.UTF-8/OLD-ENCODING');
stream_copy_to_stream($fd, fopen($output, 'w'));
24 голосов
/ 01 марта 2013
<?php
function writeUTF8File($filename,$content) { 
        $f=fopen($filename,"w"); 
        # Now UTF-8 - Add byte order mark 
        fwrite($f, pack("CCC",0xef,0xbb,0xbf)); 
        fwrite($f,$content); 
        fclose($f); 
} 
?>
5 голосов
/ 30 января 2011

Iconv на помощь.

3 голосов
/ 30 января 2011

В Unix / Linux можно также использовать простую команду оболочки для преобразования всех файлов из данного каталога:

 recode L1..UTF8 dir/*

Может быть также запущен через PHPs exec ().

1 голос
/ 26 января 2016
//add BOM to fix UTF-8 in Excel
fputs($fp, $bom =( chr(0xEF) . chr(0xBB) . chr(0xBF) ));

Я получил эту строку от Круто

0 голосов
/ 05 октября 2017

Я собрал все вместе и получил простой способ конвертировать текстовые файлы ANSI в "UTF-8 No Mark":

function filesToUTF8($searchdir,$convdir,$filetypes) {
  $get_files = glob($searchdir.'*{'.$filetypes.'}', GLOB_BRACE);
  foreach($get_files as $file) {
    $expl_path = explode('/',$file);
    $filename = end($expl_path);
    $get_file_content = file_get_contents($file);
    $new_file_content = iconv(mb_detect_encoding($get_file_content, mb_detect_order(), true), "UTF-8", $get_file_content);
    $put_new_file = file_put_contents($convdir.$filename,$new_file_content);
  }
}

Использование: filesToUTF8 ('C: / Temp /', 'C: /Temp / conv_files /», 'PHP, TXT');

0 голосов
/ 28 февраля 2016
  1. Откройте ваши файлы в блокноте Windows
  2. Измените кодировку на кодировку UTF-8
  3. Сохраните файл
  4. Попробуйте еще раз!: O)
0 голосов
/ 30 сентября 2014

Это работает для меня. :)

$f=fopen($filename,"w"); 
# Now UTF-8 - Add byte order mark 
fwrite($f, pack("CCC",0xef,0xbb,0xbf)); 
fwrite($f,$content); 
fclose($f); 
0 голосов
/ 12 февраля 2013

Если вы хотите использовать рекурсивный рекурсив и фильтровать по типу, попробуйте это:

find . -name "*.html" -exec recode L1..UTF8 {} \;
...