Функция LEN

Функция LEN(<строковое выражение>) возвращает число символов в строке, задаваемой строковым выражением. Ограничимся случаем, когда число символов больше единицы:

SELECT *
FROM (SELECT class +' '+ name AS cn
      FROM Ships
      UNION ALL
      SELECT 'a' AS nc
     ) x
WHERE LEFT(cn, 1) = RIGHT(cn, 1)
      AND LEN(cn) > 1;

🚫

[[ error ]]

[[ column ]]
NULL [[ value ]]

Реализация функции LEN() в MS SQL Server имеет одну особенность, а именно, она не учитывает концевые пробелы.

Давайте выполним следующий код:

DECLARE @chr AS CHAR(12), @vchr AS VARCHAR(12);
SELECT @chr = 'abcde' + REPLICATE(' ', 5), @vchr = 'abcde'+REPLICATE(' ', 5);
SELECT LEN(@chr), LEN(@vchr);
SELECT DATALENGTH(@chr), DATALENGTH(@vchr);


5	5
12	10

Функция REPLICATE добавляет справа к константе ‘abcde’ пять пробелов, которые не учитываются функцией LEN, - в обоих случаях мы получаем 5.

Функция DATALENGTH возвращает число байтов в строковом представлении и демонстрирует различие в типах данных CHAR и VARCHAR. DATALENGTH возвращает 12 для типа CHAR(12), и 10 - для VARCHAR(12).

Как и следовало ожидать, DATALENGTH для переменной типа VARCHAR вернула фактическую длину строковой переменной. Но почему для переменной типа CHAR результат оказался равным 12? Дело в том, что CHAR является типом данных фиксированной длины. Если значение переменной меньше объявленной длины, а мы использовали CHAR(12), значение переменной будет дополнено концевыми пробелами, чтобы “выровнять” длину до 12 символов.

На сайте имеются задачи, в которых требуется упорядочить (найти максимум и т. д.) в числовом порядке значения, представленные в текстовом формате. Например, номер места в самолете (2d) или скорость привода CD-ROM (24x). Проблема заключается в том, что текст сортируется так (по возрастанию):


11a
1a
2a

Действительно,

SELECT '1a' AS place
UNION ALL
SELECT '2a'
UNION ALL
SELECT '11a'
ORDER BY 1;

🚫

[[ error ]]

[[ column ]]
NULL [[ value ]]

Если же требуется упорядочить места в самолете в порядке следования рядов, то порядок должен быть таким:


1a
2a
11a

Чтобы добиться такого порядка, нужно выполнить сортировку по числовым значениям, присутствующим в тексте. Можно использовать такой алгоритм:

Извлечь число из строки.
Привести его к числовому формату.
Выполнить сортировку по приведенному значению.

Так как нам известно, что буква только одна, то для извлечения числа из строки можно воспользоваться следующей конструкцией, которая не зависит от числа цифр в номере места:

LEFT(place, LEN(place) - 1)

Если только этим и ограничиться, то получим

place
1a
11a
2a

Приведение к числовому формату может быть следующим:

CAST (LEFT(place, LEN(place) - 1) AS INT)

Осталось выполнить сортировку:

SELECT *
FROM (SELECT '1a' AS place
      UNION ALL
      SELECT '2a'
      UNION ALL
      SELECT '11a'
     ) x
ORDER BY CAST(LEFT(place, LEN(place) - 1) AS INT);

🚫

[[ error ]]

[[ column ]]
NULL [[ value ]]

Что и требовалось доказать.

Ранее мы для извлечения числа из текстовой строки пользовались функцией LEFT, так как нам было известно априори, какое число символов нужно убрать справа (один). А если же нужно извлечь строку из подстроки не по известной позиции символа, а по самому символу? Например: извлечь все символы до первой буквы х (в представлении значения скорости привода CD-ROM).

В этом случае мы можем использовать также уже рассмотренную ранее функцию CHARINDEX, которая позволит определить неизвестную позицию символа:

SELECT model, LEFT(cd, CHARINDEX('x', cd) -1)
FROM PC;

🚫

[[ error ]]

[[ column ]]
NULL [[ value ]]

Функция LEN(), концевые пробелы и уникальность

#CHARINDEX #LEN #Строковые Функции #LEFT #REPLICATE #DATALENGTH