9.5. 二进制串函数和操作符

本节描述那些检查和操作类型为bytea的值的函数和操作符。

SQL定义了一些使用关键字而不是逗号来分割参数的串函数。详情请见Table 9.11PostgreSQL也提供了这些函数使用常规函数调用语法的版本(参阅Table 9.12)。

Note

本页中显示的示例结果假设服务器参数bytea_output被设置为escape(传统PostgreSQL格式)。

Table 9.11. SQL二进制串函数和操作符

函数返回类型描述例子结果
string || string bytea 串连接 '\\Post'::bytea || '\047gres\\000'::bytea\\Post'gres\000
octet_length(string) int二进制串中的字节数octet_length('jo\000se'::bytea)5
overlay(string placing string from int [for int]) bytea 替换子串 overlay('Th\000omas'::bytea placing '\002\003'::bytea from 2 for 3)T\\002\\003mas
position(substring in string) int指定子串的位置position('\000om'::bytea in 'Th\000omas'::bytea)3
substring(string [from int] [for int]) bytea 提取子串 substring('Th\000omas'::bytea from 2 for 3)h\000o
trim([both] bytes from string) byteastring的开头或结尾删除只包含出现在bytes中字节的最长串 trim('\000\001'::bytea from '\000Tom\001'::bytea)Tom

还有一些二进制串处理函数可以使用,在Table 9.12列出。 其中有一些是在内部使用,用于实现Table 9.11列出的 SQL 标准串函数。

Table 9.12. 其他二进制串函数

函数返回类型描述例子结果
btrim(string bytea, bytes bytea) byteastring的开头或结尾删除只由出现在bytes中字节组成的最长串 btrim('\000trim\001'::bytea, '\000\001'::bytea)trim
decode(string text, format text) byteastring中的文本表示解码二进制数据。format的参数和在encode中一样。 decode('123\000456', 'escape')123\000456
encode(data bytea, format text) text 将二进制数据编码为一个文本表示。支持的格式有:base64hexescapeescape将零字节和高位组字节转换为八进制序列(\nnn)和双反斜线。 encode('123\000456'::bytea, 'escape')123\000456
get_bit(string, offset) int 从串中抽取位 get_bit('Th\000omas'::bytea, 45)1
get_byte(string, offset) int 从串中抽取字节 get_byte('Th\000omas'::bytea, 4)109
length(string) int 二进制串的长度 length('jo\000se'::bytea)5
md5(string) text 计算string的MD5哈希码,以十六进制形式返回结果 md5('Th\000omas'::bytea)8ab2d3c9689aaf18​b4958c334c82d8b1
set_bit(string, offset, newvalue) bytea 设置串中的位 set_bit('Th\000omas'::bytea, 45, 0)Th\000omAs
set_byte(string, offset, newvalue) bytea 设置串中的字节 set_byte('Th\000omas'::bytea, 4, 64)Th\000o@as
sha224(bytea) bytea SHA-224哈希 sha224('abc')\x23097d223405d8228642a477bda2​55b32aadbce4bda0b3f7e36c9da7
sha256(bytea) bytea SHA-256哈希 sha256('abc')\xba7816bf8f01cfea414140de5dae2223​b00361a396177a9cb410ff61f20015ad
sha384(bytea) bytea SHA-384哈希 sha384('abc')\xcb00753f45a35e8bb5a03d699ac65007​272c32ab0eded1631a8b605a43ff5bed​8086072ba1e7cc2358baeca134c825a7
sha512(bytea) bytea SHA-512哈希 sha512('abc')\xddaf35a193617abacc417349ae204131​12e6fa4e89a97ea20a9eeee64b55d39a​2192992a274fc1a836ba3c23a3feebbd​454d4423643ce80e2a9ac94fa54ca49f

get_byteset_byte把一个二进制串中的一个字节计数为字节 0。get_bitset_bit在每一个字节中从右边起计数位;例如位 0 是第一个字节的最低有效位,而位 15 是第二个字节的最高有效位。

注意由于历史原因,函数md5返回的是一个十六进制编码的text值,而SHA-2函数返回类型bytea。可以使用函数encodedecode在两者之间转换,例如encode(sha256('abc'), 'hex')可以得到一个十六进制编码的文本表示。

参见Section 9.20中的聚集函数string_agg以及Section 35.4中的大对象函数。