Шрифт:
Интервал:
Закладка:
s1, s2, s1.IndexOf("E"));
Console.WriteLine("Ignore case: s1.IndexOf("E",
StringComparison.OrdinalIgnoreCase):
{0}", s1.IndexOf("E",
StringComparison.OrdinalIgnoreCase));
Console.WriteLine("Ignore case, Invariant Culture: s1.IndexOf("E",
StringComparison.InvariantCultureIgnoreCase): {0}",
s1.IndexOf("E", StringComparison.InvariantCultureIgnoreCase));
Console.WriteLine();
}
В то время как приведенные здесь примеры просты и используют те же самые буквы в большинстве культур, если ваше приложение должно принимать во внимание разные наборы культур, тогда применение перечисления StringComparison становится обязательным.
Строки неизменяемы
Один из интересных аспектов класса System.String связан с тем, что после присваивания объекту string начального значения символьные данные не могут быть изменены. На первый взгляд это может показаться противоречащим действительности, ведь строкам постоянно присваиваются новые значения, а в классе System.String доступен набор методов, которые, похоже, только то и делают, что изменяют символьные данные тем или иным образом (скажем, преобразуя их в верхний или нижний регистр). Тем не менее, присмотревшись внимательнее к тому, что происходит "за кулисами", вы заметите, что методы типа string на самом деле возвращают новый объект string в модифицированном виде:
static void StringsAreImmutable()
{
Console.WriteLine("=> Immutable Strings:a");
// Установить начальное значение для строки.
string s1 = "This is my string.";
Console.WriteLine("s1 = {0}", s1);
// Преобразована ли строка si в верхний регистр?
string upperString = s1.ToUpper();
Console.WriteLine("upperString = {0}", upperString);
// Нет! Строка si осталась в том же виде!
Console.WriteLine("s1 = {0}", s1);
}
Просмотрев показанный далее вывод, можно убедиться, что в результате вызова метода ToUpper() исходный объект string(s1) не преобразовывался в верхний регистр. Взамен была возвращена копия переменной типа string в измененном формате.
s1 = This is my string.
upperString = THIS IS MY STRING.
s1 = This is my string.
Тот же самый закон неизменяемости строк действует и в случае применения операции присваивания С#. Чтобы проиллюстрировать, реализуем следующий метод StringsAreImmutable2():
static void StringsAreImmutable2()
{
Console.WriteLine("=> Immutable Strings 2:a");
string s2 = "My other string";
s2 = "New string value";
}
Скомпилируйте приложение и запустите ildasm.exe (см. главу 1). Ниже приведен код CIL, который будет сгенерирован для метода StringsAreImmutable2():
.method private hidebysig static void StringsAreImmutable2() cil managed
{
// Code size 21 (0x15)
.maxstack 1
.locals init (string V_0)
IL_0000: nop
IL_0001: ldstr "My other string"
IL_0006: stloc.0
IL_0007: ldstr "New string value" /* 70000B3B */
IL_000c: stloc.0
IL_000d: ldloc.0
IL_0013: nop
IL_0014: ret
} // end of method Program::StringsAreImmutable2
Хотя низкоуровневые детали языка CIL пока подробно не рассматривались, обратите внимание на многочисленные вызовы кода операции ldstr ("load string" — "загрузить строку"). Попросту говоря, код операции ldstr языка CIL загружает новый объект string в управляемую кучу. Предыдущий объект string, который содержал значение "Му other string", будет со временем удален сборщиком мусора.
Так что же в точности из всего этого следует? Выражаясь кратко, класс string может стать неэффективным и при неправильном употреблении приводить к "разбуханию" кода, особенно при выполнении конкатенации строк или при работе с большими объемами текстовых данных. Но если необходимо представлять элементарные символьные данные, такие как номер карточки социального страхования, имя и фамилия или простые фрагменты текста, используемые внутри приложения, тогда тип string будет идеальным вариантом.
Однако когда строится приложение, в котором текстовые данные будут часто изменяться (подобное текстовому процессору), то представление обрабатываемых текстовых данных с применением объектов string будет неудачным решением, т.к. оно практически наверняка (и часто косвенно) приведет к созданию излишних копий строковых данных. Тогда каким образом должен поступить программист? Ответ на этот вопрос вы найдете ниже.
Использование типа System.Text.StringBuilder
С учетом того, что тип string может оказаться неэффективным при необдуманном использовании, библиотеки базовых классов .NET Core предоставляют пространство имен System.Text. Внутри этого (относительно небольшого) пространства имен находится класс StringBuilder. Как и System.String, класс StringBuilder определяет методы, которые позволяют, например, заменять или форматировать сегменты. Для применения класса StringBuilder в файлах кода C# первым делом понадобится импортировать следующее пространство имен в файл кода (что в случае нового проекта Visual Studio уже должно быть сделано):
// Здесь определен класс StringBuilder:
using System.Text;
Уникальность класса StringBuilder в том, что при вызове его членов производится прямое изменение внутренних символьных данных объекта (делая его более эффективным) без получения копии данных в модифицированном формате. При создании экземпляра StringBuilder начальные значения объекта могут быть заданы через один из множества конструкторов. Если вы не знакомы с понятием конструктора, тогда пока достаточно знать только то, что конструкторы позволяют создавать объект с начальным состоянием при использовании ключевого слова new. Взгляните на следующий пример применения StringBuilder:
static void FunWithStringBuilder()
{
Console.WriteLine("=> Using the StringBuilder:");
StringBuilder sb = new StringBuilder("**** Fantastic Games ****");
sb.Append("n");
sb.AppendLine("Half Life");
sb.AppendLine("Morrowind");
sb.AppendLine("Deus Ex" + "2");
sb.AppendLine("System Shock");
Console.WriteLine(sb.ToString());
sb.Replace("2", " Invisible War");
Console.WriteLine(sb.ToString());
Console.WriteLine("sb has {0} chars.", sb.Length);
Console.WriteLine();
}
Здесь создается объект StringBuilder с начальным значением "**** Fantastic Games ****". Как видите, можно добавлять строки в конец внутреннего буфера, а также заменять или удалять любые символы. По умолчанию StringBuilder способен хранить строку только длиной 16 символов или меньше (но при необходимости будет автоматически расширяться): однако стандартное начальное значение длины можно изменить посредством дополнительного аргумента конструктора:
// Создать экземпляр StringBuilder с исходным размером в 256 символов.
StringBuilder sb = new StringBuilder("**** Fantastic Games ****", 256);
При добавлении большего количества символов, чем в указанном лимите, объект StringBuilder скопирует свои данные в новый экземпляр и увеличит размер буфера на