Кодировка хеш-ключей: почему я получаю здесь с Devel :: Peek :: Dump два разных результата? - PullRequest
12 голосов
/ 07 декабря 2011

Почему я получаю здесь Devel :: Peek :: Dump два разных результата?

#!/usr/bin/env perl
use warnings;
use 5.014;
use utf8;
binmode STDOUT, ':encoding(utf-8)';
use Devel::Peek;

my %hash1 = ( 'müller' => 1 );
say Dump $_ for keys %hash1;

my %hash2;
$hash2{'müller'} = 1;
say Dump $_ for keys %hash2;

Вывод:

SV = PV(0x753270) at 0x76d230
  REFCNT = 2
  FLAGS = (POK,pPOK,UTF8)
  PV = 0x759750 "m\303\274ller"\0 [UTF8 "m\x{fc}ller"]
  CUR = 7
  LEN = 8

SV = PV(0x753270) at 0x7d75a8
  REFCNT = 2
  FLAGS = (POK,FAKE,READONLY,pPOK)
  PV = 0x799110 "m\374ller"
  CUR = 6
  LEN = 0

Ответы [ 2 ]

4 голосов
/ 08 декабря 2011

Оба этих скаляра содержат одинаковую строку.Единственное отличие состоит только в том, как строка хранится внутри.

Я предполагаю, что ключ нормализован для упрощения сравнений при попытке найти ключ в хэше.

1 голос
/ 10 декабря 2011

Это не ответ, я считаю, что икегами ответ правильный.Я просто хотел добавить некоторые наблюдения с помощью некоторого кода.

Я выполнил следующий код с 5.10 до 5.15, и поведение было согласованным.

use utf8;
use Test::More;

{
    my %h = ('müller' => 1);
    my $k = (keys %h)[0];
    ok(utf8::is_utf8($k), 'UTF-8 Latin-1 hash key has SvUTF8 set');
}

{
    my %h = ('müller' => 1);
       $h{'müller'} = 2;
    my $k = (keys %h)[0];
    ok( ! utf8::is_utf8($k), 'UTF-8 Latin-1 hash key does not has SvUTF8 set after assignment');
}

{
    my %h = ('☺' => 1);
       $h{'☺'} = 2;
    my $k = (keys %h)[0];
    ok(utf8::is_utf8($k), 'UTF-8 (> Latin-1) hash key has SvUTF8 set after assignment');
}

done_testing;

Если ожидается второй тест, он будетбыть первым тихим понижением, о котором я знаю.Я думаю, что у p5p есть окончательный ответ, является ли это ошибкой оптимизации или ожидаемым поведением.(sv_dump выглядит как оптимизация (POK, FAKE, READONLY, pPOK))

...