| Россия |
Символы и строки
Обработка текстовой информации является одной из самых распространенных задач современного программировании. С# предоставляет для ее решения широкий набор средств: символы char, неизменяемые строки string, изменяемые строки StringBuider и регулярные выражения Regex. В данном разделе мы рассмотрим работу с символами, неизменяемыми и изменяемыми строками.
Символы char
Символьный тип char предназначен для хранения символа в кодировке Unicode. Символьный тип относится к встроенным типам данных С# и соответствует стандартному классу Сhar библиотеки .Net из пространства имен System. В этом классе определены статические методы, позволяющие задавать вид и категорию символа, а также преобразовывать символ в верхний или нижний регистр, в число. Рассмотрим основные методы:
| Метод | Описание |
|---|---|
| GetNumericValue | Возвращает числовое значение символа, если он является цифрой, и -1 в противном случае. |
| GetUnicodeCategory | Возвращает категорию Unicode-символа. В Unicode символы разделены на категории, например цифры ( DecimalDigitNumber ), римские цифры ( LetterNumber ), разделители строк ( LineSeparator ), буквы в нижнем регистре ( LowercaseLetter ) и т.д. |
| IsControl | Возвращает true, если символ является управляющим. |
| IsDigit | Возвращает true, если символ является десятичной цифрой. |
| IsLetter | Возвращает true, если символ является буквой. |
| IsLetterOrDigit | Возвращает true, если символ является буквой или десятичной цифрой. |
| IsLower | Возвращает true, если символ задан в нижнем регистре. |
| IsNumber | Возвращает true, если символ является числом (десятичным или шестнадцатеричным). |
| IsPunctuation | Возвращает true, если символ является знаком препинания. |
| IsSeparator | Возвращает true, если символ является разделителем. |
| IsUpper | Возвращает true, если символ задан в верхнем регистре. |
| IsWhiteSpace | Возвращает true, если символ является пробельным (пробел, перевод строки, возврат каретки). |
| Parse | Преобразует строку в символ (строка должна состоять из одного символа). |
| ToLower | Преобразует символ в нижний регистр |
| ToUpper | Преобразует символ в верхний регистр |
В следующем примере рассмотрим применение данных методов:
static void Main()
{
try
{
char b = 'B', c = '\x64', d = '\uffff';
Console.WriteLine("{0}, {1}, {2}", b, c, d);
Console.WriteLine("{0}, {1}, {2}", char.ToLower(b), char.ToUpper(c), char.GetNumericValue(d));
char a;
do //цикл выполнятеся до тех пор, пока не ввели символ e
{
Console.WriteLine("Введите символ: ");
a = char.Parse(Console.ReadLine());
Console.WriteLine("Введен символ {0}, его код {1}, его категория {2}", a,
(int)a, char.GetUnicodeCategory(a));
if (char.IsLetter(a)) Console.WriteLine("Буква");
if (char.IsUpper(a)) Console.WriteLine("Верхний регистр");
if (char.IsLower(a)) Console.WriteLine("Нижний регистр");
if (char.IsControl(a)) Console.WriteLine("Управляющий символ");
if (char.IsNumber(a)) Console.WriteLine("Число");
if (char.IsPunctuation(a)) Console.WriteLine("Разделитель");
} while (a != 'e');
}
catch
{
Console.WriteLine("Возникло исключение");
}
}Используя символьный тип можно оргранизовать массив символов и работать с ним на основе базового класса Array:
static void Main()
{
char[] a ={ 'm', 'a', 'Х', 'i', 'M', 'u', 'S' , '!', '!', '!' };
char [] b="кол около колокола".ToCharArray(); //преобразование строки в массив символов
PrintArray("Исходный массив а:", a);
for (int x=0;x<a.Length; x++)
if (char.IsLower(a[x])) a[x]=char.ToUpper(a[x]);
PrintArray("Измененный массив а:", a);
PrintArray("Исходный массив b:", b);
Array.Reverse(b);
PrintArray("Измененный массив b:", b);
}
static void PrintArray(string line, Array a)
{
Console.WriteLine(line);
foreach( object x in a) Console.Write(x);
Console.WriteLine('\n');
}Неизменяемые строки string
Тип string, предназначенный для работы со строками символов в кодировке Unicode, является встроенным типом С#. Ему соответствует базовый тип класса System.String библиотеки .Net. Каждый объект string - это неизменяемая последовательность символов Unicode, т.е. методы, предназначенные для изменения строк, возвращают измененные копии, исходные же строки остаются неизменными.
Создать строку можно несколькими способами:
-
string s; // инициализация отложена
-
string s=''кол около колокола''; //инициализация строковым литералом
-
string s=@'Привет!' //символ @ сообщает конструктору string, что строку Сегодня хорошая погода!!! '' // нужно воспринимать буквально, даже если она занимает //несколько строк
-
string s=new string (' ', 20); //конструктор создает строку из 20 пробелов -
int x = 12344556; //инициализировали целочисленную переменную string s = x.ToString(); //преобразовали ее к типу string
-
char [] a={'a', 'b', 'c', 'd', 'e'}; //создали массив символов string v=new string (a); // создание строки из массива символов -
char [] a={'a', 'b', 'c', 'd', 'e'}; // создание строки из части массива символов, при этом: 0 string v=new string (a, 0, 2) // показывает с какого символа, 2 - сколько символов // использовать для инициализации
Класс string обладает богатым набором методов для сравнения строк, поиска в строке и других действий со строками. Рассмотрим эти методы.
Напоминаем, что вызов статических методов происходит через обращение к имени класса, например, String.Concat(str1, str2), в остальных случаях через обращение к экземплярам класса, например, str.ToLower(). На примере рассмотрим использование данных свойств и методов.
static void Main()
{
string str1 ="Первая строка";
string str2 = string.Copy(str1);
string str3 = "Вторая строка";
string str4 = "ВТОРАЯ строка";
string strUp, strLow;
int result, idx;
Console.WriteLine("str1: " + str1);
Console.WriteLine("Длина строки str1: " +str1.Length);
// Создаем прописную и строчную версии строки str1.
strLow = str1.ToLower();
strUp = str1.ToUpper();
Console.WriteLine("Строчная версия строки str1: " +strLow);
Console.WriteLine("Прописная версия строки str1: " +strUp);
Console.WriteLine();
// Сравниваем строки,
result = str1.CompareTo(str3);
if (result == 0) Console.WriteLine("str1 и str3 равны.");
else if (result < 0) Console.WriteLine("str1 меньше, чем str3");
else Console.WriteLine("str1 больше, чем str3");
Console.WriteLine();
//сравниваем строки без учета регистра
result = String.Compare(str3,str4,true);
if (result == 0) Console.WriteLine("str3 и str4 равны без учета регистра.");
else Console.WriteLine("str3 и str4 не равны без учета регистра.");
Console.WriteLine();
//сравниваем части строк
result = String.Compare(str1, 4, str2, 4, 2);
if (result == 0) Console.WriteLine("часть str1 и str2 равны");
else Console.WriteLine("часть str1 и str2 не равны");
Console.WriteLine();
// Поиск строк.
idx = str2.IndexOf("строка");
Console.WriteLine("Индекс первого вхождения подстроки строка: " + idx);
idx = str2.LastIndexOf("о");
Console.WriteLine("Индекс последнего вхождения символа о: " + idx);
//конкатенация
string str=String.Concat(str1, str2, str3, str4);
Console.WriteLine(str);
//удаление подстроки
str=str.Remove(0,str1.Length);
Console.WriteLine(str);
//замена подстроки "строка" на пустую подстроку
str=str.Replace("строка","");
Console.WriteLine(str);
}Очень важными методами обработки строк, являются методы разделения строки на элементы Split и слияние массива строк в единую строку Join.
static void Main()
{
string poems = "тучки небесные вечные странники";
char[] div = { ' '}; //создаем массив разделителей
// Разбиваем строку на части,
string[] parts = poems.Split(div);
Console.WriteLine("Результат разбиения строки на части: ");
for (int i = 0; i < parts.Length; i++)
Console.WriteLine(parts[i]);
// Теперь собираем эти части в одну строку, в качестве разделителя используем символ |
string whole = String.Join(" | ", parts);
Console.WriteLine("Результат сборки: ");
Console.WriteLine(whole);
}В общем случае строка может содержать и другие разделители:
static void Main()
{
string poems = "Тучки небесные, вечные странники...";
char[] div = { ' ', ',', '.'}; //создаем массив разделителей
// Разбиваем строку на части,
string[] parts = poems.Split(div);
Console.WriteLine("Результат разбиения строки на части: ");
for (int i = 0; i < parts.Length; i++)
Console.WriteLine(parts[i]);
// Теперь собираем эти части в одну строку,
string whole = String.Join(" | ", parts);
Console.WriteLine("Результат сборки: ");
Console.WriteLine(whole);
}- Объясните, почему в массиве строк parts появились пустые строки.
- Внесите изменения в программу так, чтобы пустых строк не было.
Рассмотрим другой пример - используя метод Split вводить двумерный массив можно не поэлементно, а построчно:
static void Main()
{
try
{
int[][] MyArray;
Console.Write("введите количество строк: ");
int n = int.Parse(Console.ReadLine());
MyArray = new int[n][];
for (int i = 0; i < MyArray.Length; i++)
{
string line = Console.ReadLine();
string[] mas = line.Split(' ');
MyArray[i] = new int[mas.Length];
for (int j = 0; j < MyArray[i].Length; j++)
{
MyArray[i][j] = int.Parse(mas[j]);
}
}
PrintArray("исходный массив:", MyArray);
for (int i = 0; i < MyArray.Length; i++) Array.Sort(MyArray[i]);
PrintArray("итоговый массив", MyArray);
}
catch
{
Console.WriteLine("возникло исключение");
}
}
static void PrintArray(string a, int[][] mas)
{
Console.WriteLine(a);
for (int i = 0; i < mas.Length; i++)
{
foreach (int x in mas[i]) Console.Write("{0} ", x);
Console.WriteLine();
}
}В этом примере могут возникнуть исключительные ситуации, если введенная строка элементов массива будет содержать лишние пробелы. Следовательно, от этих пробелов нужно избавиться:
static void Main()
{
try
{
int[][] MyArray;
Console.Write("введите количество строк: ");
string line= Console.ReadLine()
int n = int.Parse(line.Trim());
MyArray = new int[n][];
for (int i = 0; i < MyArray.Length; i++)
{
line = Console.ReadLine();
line=line.Trim(); //удалаяем пробелы в начале и конце строки
//удаляем линшие пробелы внутри строки
n = line.IndexOf(" ");
while (n > 0)
{
line = line.Remove(n, 1);
n = line.IndexOf(" ");
}
string[] mas = line.Split(' ');
MyArray[i] = new int[mas.Length];
for (int j = 0; j < MyArray[i].Length; j++)
{
MyArray[i][j] = int.Parse(mas[j]);
}
}
PrintArray("исходный массив:", MyArray);
for (int i = 0; i < MyArray.Length; i++) Array.Sort(MyArray[i]);
PrintArray("итоговый массив", MyArray);
}
catch
{
Console.WriteLine("возникло исключение");
}
}
static void PrintArray(string a, int[][] mas)
{
Console.WriteLine(a);
for (int i = 0; i < mas.Length; i++)
{
foreach (int x in mas[i]) Console.Write("{0} ", x);
Console.WriteLine();
}
}При работе с объектами класса string нужно учитывать их свойство неизменяемости, т.е. тот факт, что методы изменяют не сами строки, а их копии. Рассмотрим фрагмент программы:
string a=""; for (int i = 1; i <= 100; i++) a +="!"; Console.WriteLine(a);
В этом случае в памяти компьютера будет сформировано 100 различных строк вида:
! !! !!! … !!!...!!
И только последняя строка будет храниться в переменной а. Ссылки на все остальные строчки будут потеряны, но эти строки будут храниться в памяти компьютера и засорять память. Бороться с таким засорением придется сборщику мусора, что будет сказываться на производительности программы. Поэтому если нужно изменять строку, то лучше пользоваться классом StringBuilder.