第十章 SQL排序(一)

2021-03-15  本文已影响0人  Cache技术分享

第十章 SQL排序

排序规则指定值的排序和比较方式,并且是InterSystems SQL和InterSystemsIRIS®数据平台对象的一部分。有两种基本排序规则:数字和字符串。

默认的字符串排序规则是SQLUPPER;为每个名称空间设置此默认值。 SQLUPPER排序规则将所有字母都转换为大写(出于排序的目的),并在字符串的开头附加一个空格字符。此转换仅用于整理目的;在InterSystems中,无论所应用的排序规则如何,SQL字符串通常以大写和小写字母显示,并且字符串的长度不包括附加的空格字符。

时间戳记是一个字符串,因此遵循当前的字符串排序规则。但是,由于时间戳是ODBC格式,因此如果指定了前导零,则字符串排序规则与时间顺序相同。

可以使用“ObjectScript排序后”运算符来确定两个值的相对排序顺序。

可以按以下方式指定排序规则:

排序类型

排序规则可以在字段/属性的定义或索引的定义中指定为关键字。

可以通过对查询子句中的字段名应用排序规则函数来指定排序规则。
在指定排序函数时必须使用%前缀。

排序规则采用升序的ASCII/Unicode序列,具有以下转换:

注意:还有多种传统排序规则类型,不建议使用。

在SQL查询中,可以指定不带括号%SQLUPPER Name或带括号%SQLUPPER(Name)的排序规则函数。如果排序规则函数指定了截断,则必须使用括号%SQLUPPER(Name,10)

三种排序规则类型:SQLSTRINGSQLUPPERTRUNCATE支持可选的maxlen整数值。如果指定,maxlen会将字符串的分析截断为前n个字符。在对长字符串进行索引和排序时,可以使用它来提高性能。可以在查询中使用maxlen进行排序,分组或返回截断的字符串值。

还可以使用 %SYSTEM.Util.Collation()方法执行排序规则类型转换。

命名空间范围的默认排序规则

每个名称空间都有一个当前的字符串排序规则设置。此字符串排序规则是为%Library.String中的数据类型定义的。默认值为SQLUPPER。此默认值可以更改。

可以基于每个命名空间定义排序规则默认值。默认情况下,名称空间没有分配的排序规则,这意味着它们使用SQLUPPER排序规则。可以为命名空间分配其他默认排序规则。此名称空间默认排序规则适用于所有进程,并且在InterSystems上保持不变,IRIS会重新启动,直到明确重置为止。

/// d ##class(PHA.TEST.SQL).Collation()
ClassMethod Collation()
{
    SET stat=$$GetEnvironment^%apiOBJ("collation","%Library.String",.collval)
    WRITE "初始排序 ",$NAMESPACE,!
    ZWRITE collval
SetNamespaceCollation
    DO SetEnvironment^%apiOBJ("collation","%Library.String","SQLstring")
    SET stat=$$GetEnvironment^%apiOBJ("collation","%Library.String",.collnew)
    WRITE "user-assigned排序为 ",$NAMESPACE,!
    ZWRITE collnew
ResetCollationDefault
    DO SetEnvironment^%apiOBJ("collation","%Library.String",.collval)
    SET stat=$$GetEnvironment^%apiOBJ("collation","%Library.String",.collreset)
    WRITE "恢复排序规则的默认值 ",$NAMESPACE,!
    ZWRITE collreset
}

DHC-APP>d ##class(PHA.TEST.SQL).Collation()
初始排序 DHC-APP
user-assigned排序为 DHC-APP
collnew="SQLstring"
恢复排序规则的默认值 DHC-APP

注意,如果从未设置名称空间排序的默认值,那么$$GetEnvironment将返回一个未定义的排序变量,例如本例中的.collval
这个未定义的排序规则默认为SQLUPPER

注意:如果数据包含德语文本,大写排序规则可能不是理想的默认设置。
这是因为德语eszett字符($CHAR(223))只有小写形式。
相当于大写的是两个字母“SS”
转换为大写的SQL排序规则不会转换eszett, eszett保持为单个小写字母不变。

表字段/属性定义排序

在SQL中,排序规则可以分配为字段/属性定义的一部分。字段使用的数据类型确定其默认排序规则。字符串数据类型的默认排序规则为SQLUPPER。非字符串数据类型不支持排序规则分配。

可以在CREATE TABLEALTER TABLE中为字段指定排序规则:

CREATE TABLE Sample.MyNames (
    LastName CHAR(30),
    FirstName CHAR(30) COLLATE SQLstring)

注意:使用CREATE TABLE``和ALTER TABLE为字段指定排序规则时,前缀是可选的:COLLATE SQLstringCOLLATE %SQLstring

在使用持久类定义定义表时,可以为属性指定排序规则:

Class Sample.MyNames Extends %Persistent [DdlAllowed]
{
Property LastName As %String;
Property FirstName As %String(COLLATION = "SQLstring");
}

注意:在为类定义和类方法指定排序规则时,请勿将前缀用于排序规则类型名称。

在这些示例中,LastName字段采用默认排序规则(SQLUPPER,不区分大小写),FirstName字段使用区分大小写的SQLSTRING排序规则进行定义。

如果更改类属性的排序规则,并且已经存储了该类的数据,则该属性上的所有索引都将变为无效。必须基于此属性重建所有索引。

索引定义排序

CREATE INDEX命令无法指定索引排序规则类型。索引使用与要索引的字段相同的排序规则。

定义为类定义一部分的索引可以指定排序规则类型。默认情况下,给定一个或多个给定属性的索引使用属性数据的排序规则类型。例如,假设已定义类型为%String的属性Name

Class MyApp.Person Extends %Persistent [DdlAllowed]
{
Property Name As %String;
Index NameIDX On Name;
}

名称的排序规则为SQLUPPER%String的默认值)。假设“Person”表包含以下数据:

ID Name
1 Jones
2 JOHNSON
3 Smith
4 jones
5 SMITH

然后,Name上的索引将包含以下条目:

Name ID(s)
JOHNSON 2
JONES 1, 4
SMITH 3, 5

SQL引擎可以将此索引直接用于ORDER BY或使用“Name”字段进行比较操作。

可以通过在索引定义中添加一个As子句来覆盖用于索引的默认排序规则:

Class MyApp.Person Extends %Persistent [DdlAllowed]
{
Property Name As %String;
Index NameIDX On Name As SQLstring;
}

在这种情况下,NameIDX索引现在将以SQLSTRING(区分大小写)的形式存储值。使用上面示例中的数据:

Name ID(s)
JOHNSON 2
Jones 1
jones 4
SMITH 5
Smith 3

在这种情况下,对于需要区分大小写排序规则的任何查询,SQL Engine都可以利用此索引。

通常,不必更改索引的排序规则。如果要使用其他排序规则,最好在属性级别定义它,然后让属性上的所有索引都采用正确的排序规则。

如果使用索引属性执行属性比较,则在比较中指定的属性应与相应索引具有相同的排序规则类型。例如,SELECTWHERE子句或JOINON子句中的Name属性应与为Name属性定义的索引具有相同的排序规则。如果属性归类和索引归类之间不匹配,则索引可能无效或根本不使用。

如果将索引定义为使用多个属性,则可以分别指定每个索引的排序规则:

Index MyIDX On (Name As SQLstring, Code As Exact);
上一篇 下一篇

猜你喜欢

热点阅读