В моем случае исходный файл имеет кодировку windows-1250 и iconv печатает тонны уведомлений о недопустимых символах во входной строке ...
Так что это решение мне очень помогло:
/**
* getting CSV array with UTF-8 encoding
*
* @param resource &$handle
* @param integer $length
* @param string $separator
*
* @return array|false
*/
private function fgetcsvUTF8(&$handle, $length, $separator = ';')
{
if (($buffer = fgets($handle, $length)) !== false)
{
$buffer = $this->autoUTF($buffer);
return str_getcsv($buffer, $separator);
}
return false;
}
/**
* automatic convertion windows-1250 and iso-8859-2 info utf-8 string
*
* @param string $s
*
* @return string
*/
private function autoUTF($s)
{
// detect UTF-8
if (preg_match('#[\x80-\x{1FF}\x{2000}-\x{3FFF}]#u', $s))
return $s;
// detect WINDOWS-1250
if (preg_match('#[\x7F-\x9F\xBC]#', $s))
return iconv('WINDOWS-1250', 'UTF-8', $s);
// assume ISO-8859-2
return iconv('ISO-8859-2', 'UTF-8', $s);
}
Ответ на ответ @ manvel - используйте str_getcsv вместо разнесения - из-за случаев, подобных этому:
some;nice;value;"and;here;comes;combinated;value";and;some;others
взорвать строку на части:
some
nice
value
"and
here
comes
combinated
value"
and
some
others
, но str_getcsv взорвать строкуна части:
some
nice
value
and;here;comes;combinated;value
and
some
others