Question

В C # в чем разница между ToUpper() и ToUpperInvariant()?

Можете ли вы привести пример, где результаты могут отличаться?

Jon Skeet · Answer 1 · 23 августа 2010

ToUpper использует текущую культуру. ToUpperInvariant использует инвариантную культуру.

Каноническим примером является Турция, где верхний регистр "i" не является "I".

Пример кода, показывающий разницу:

using System;
using System.Drawing;
using System.Globalization;
using System.Threading;
using System.Windows.Forms;

public class Test
{
    [STAThread]
    static void Main()
    {
        string invariant = "iii".ToUpperInvariant();
        CultureInfo turkey = new CultureInfo("tr-TR");
        Thread.CurrentThread.CurrentCulture = turkey;
        string cultured = "iii".ToUpper();

        Font bigFont = new Font("Arial", 40);
        Form f = new Form {
            Controls = {
                new Label { Text = invariant, Location = new Point(20, 20),
                            Font = bigFont, AutoSize = true},
                new Label { Text = cultured, Location = new Point(20, 100),
                            Font = bigFont, AutoSize = true }
            }
        };        
        Application.Run(f);
    }
}

Подробнее о турецком языке читайте в этом блоге по тестированию Турции .

Я не удивлюсь, узнав, что существуют различные другие проблемы с заглавными буквами, связанные с элитированными персонажами и т. Д. Это только один пример, который я знаю на макушке ... отчасти потому, что он укусил меня много лет назад в Java, где Я прописал строку в верхнем регистре и сравнил ее с «MAIL». Это не сработало так хорошо в Турции ...

Tergiver · Answer 2 · 23 августа 2010

Ответ Джона идеален. Я просто хотел добавить, что ToUpperInvariant - это то же самое, что ToUpper(CultureInfo.InvariantCulture).

Это делает пример Джона немного проще:

using System;
using System.Drawing;
using System.Globalization;
using System.Threading;
using System.Windows.Forms;

public class Test
{
    [STAThread]
    static void Main()
    {
        string invariant = "iii".ToUpper(CultureInfo.InvariantCulture);
        string cultured = "iii".ToUpper(new CultureInfo("tr-TR"));

        Application.Run(new Form {
            Font = new Font("Times New Roman", 40),
            Controls = { 
                new Label { Text = invariant, Location = new Point(20, 20), AutoSize = true }, 
                new Label { Text = cultured, Location = new Point(20, 100), AutoSize = true }, 
            }
        });
    }
}

Я также использовал New Times Roman , потому что это более прохладный шрифт.

Я также установил свойство Font Form вместо двух Label элементов управления, поскольку свойство Font наследуется.

И я сократил несколько других строк только потому, что мне нравится компактный (например, не рабочий) код.

Мне действительно было нечего делать в данный момент.

CaffGeek · Answer 3 · 23 августа 2010

Начните с MSDN

http://msdn.microsoft.com/en-us/library/system.string.toupperinvariant.aspx

Метод ToUpperInvariant эквивалентен ToUpper (CultureInfo.InvariantCulture)

Только потому, что заглавная1010 * i - это 'I' на английском языке, это не всегда так.

krzychu · Answer 4 · 28 апреля 2016

String.ToUpper и String.ToLower могут давать разные результаты для разных культур.Наиболее известным примером является турецкий пример , для которого преобразование строчной латинской буквы «i» в прописную не приводит к появлению заглавной буквы «I», но в турецком «I».

Что касается меня, то это даже сбивало с толку даже с изображением выше ( исходный ), я написал программу (см. Исходный кодниже), чтобы увидеть точный вывод для турецкого примера:

# Lowercase letters
Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish
English i - i (\u0069) | I (\u0049)     | I (\u0130)   | i (\u0069)     | i (\u0069)
Turkish i - ı (\u0131) | ı (\u0131)     | I (\u0049)   | ı (\u0131)     | ı (\u0131)

# Uppercase letters
Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish
English i - I (\u0049) | I (\u0049)     | I (\u0049)   | i (\u0069)     | ı (\u0131)
Turkish i - I (\u0130) | I (\u0130)     | I (\u0130)   | I (\u0130)     | i (\u0069)

Как вы можете видеть:

Прописные буквы в верхнем и нижнем регистре дают разные результаты для инвариантной культурыи турецкая культура.
Прописные буквы в верхнем регистре и строчные буквы в нижнем регистре не действуют, независимо от того, что это за культура.
Culture.CultureInvariant оставляет турецкие символы такими, как
ToUpper и ToLower являются обратимыми, то есть символ в нижнем регистре после символа верхнего регистра переводит его в исходную форму, если для обеих операций использовалась одна и та же культура.

Согласно MSDN , для Char.ToUpper и Char.ToLower Турецкий и азербайджанский языки являются единственными затронутыми культурами, потому что они единственные с односимвольными различиями в корпусах.Для строк может быть затронуто больше культур.

Исходный код консольного приложения, используемого для генерации вывода:

using System;
using System.Globalization;
using System.Linq;
using System.Text;

namespace TurkishI
{
    class Program
    {
        static void Main(string[] args)
        {
            var englishI = new UnicodeCharacter('\u0069', "English i");
            var turkishI = new UnicodeCharacter('\u0131', "Turkish i");

            Console.WriteLine("# Lowercase letters");
            Console.WriteLine("Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish");
            WriteUpperToConsole(englishI);
            WriteLowerToConsole(turkishI);

            Console.WriteLine("\n# Uppercase letters");
            var uppercaseEnglishI = new UnicodeCharacter('\u0049', "English i");
            var uppercaseTurkishI = new UnicodeCharacter('\u0130', "Turkish i");
            Console.WriteLine("Character              | UpperInvariant | UpperTurkish | LowerInvariant | LowerTurkish");
            WriteLowerToConsole(uppercaseEnglishI);
            WriteLowerToConsole(uppercaseTurkishI);

            Console.ReadKey();
        }

        static void WriteUpperToConsole(UnicodeCharacter character)
        {
            Console.WriteLine("{0,-9} - {1,10} | {2,-14} | {3,-12} | {4,-14} | {5,-12}",
                character.Description,
                character,
                character.UpperInvariant,
                character.UpperTurkish,
                character.LowerInvariant,
                character.LowerTurkish
            );
        }

        static void WriteLowerToConsole(UnicodeCharacter character)
        {
            Console.WriteLine("{0,-9} - {1,10} | {2,-14} | {3,-12} | {4,-14} | {5,-12}",
                character.Description,
                character,
                character.UpperInvariant,
                character.UpperTurkish,
                character.LowerInvariant,
                character.LowerTurkish
            );
        }
    }


    class UnicodeCharacter
    {
        public static readonly CultureInfo TurkishCulture = new CultureInfo("tr-TR");

        public char Character { get; }

        public string Description { get; }

        public UnicodeCharacter(char character) : this(character, string.Empty) {  }

        public UnicodeCharacter(char character, string description)
        {
            if (description == null) {
                throw new ArgumentNullException(nameof(description));
            }

            Character = character;
            Description = description;
        }

        public string EscapeSequence => ToUnicodeEscapeSequence(Character);

        public UnicodeCharacter LowerInvariant => new UnicodeCharacter(Char.ToLowerInvariant(Character));

        public UnicodeCharacter UpperInvariant => new UnicodeCharacter(Char.ToUpperInvariant(Character));

        public UnicodeCharacter LowerTurkish => new UnicodeCharacter(Char.ToLower(Character, TurkishCulture));

        public UnicodeCharacter UpperTurkish => new UnicodeCharacter(Char.ToUpper(Character, TurkishCulture));


        private static string ToUnicodeEscapeSequence(char character)
        {
            var bytes = Encoding.Unicode.GetBytes(new[] {character});
            var prefix = bytes.Length == 4 ? @"\U" : @"\u";
            var hex = BitConverter.ToString(bytes.Reverse().ToArray()).Replace("-", string.Empty);
            return $"{prefix}{hex}";
        }

        public override string ToString()
        {
            return $"{Character} ({EscapeSequence})";
        }
    }
}

taylonr · Answer 5 · 23 августа 2010

ToUpperInvariant использует правила из инвариантной культуры

Stefanvds · Answer 6 · 23 августа 2010

нет никакой разницы в английском. только в турецкой культуре можно найти разницу.

В C # в чем разница между ToUpper () и ToUpperInvariant ()?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

В C # в чем разница между ToUpper () и ToUpperInvariant ()?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов