mysql 的 json 路径格式
mysql 使用特定的 json 路径表达式语法来导航和提取 json 文档中的数据
基本结构
mysql 中的 json 路径遵循以下通用格式
$[路径组件]
路径组件详解
| 操作符 | 描述 | 示例 | | ----------- | --------- | --------------------- | | $ | 根对象 | $ | | . 或 [] | 成员访问 | $.name 或 $['name'] | | [*] | 数组通配符 | $.items[*] | | [n] | 数组索引 | $[0] | | [m to n] | 数组范围 | $[1 to 3] | | ** | 递归通配符 | $**.price |
1. 根对象 ($
)
$
表示整个 json 文档
2. 成员访问 (.
或 []
)
- 点号表示法:
$.store.book
- 括号表示法:
$['store']['book']
- 当键名包含特殊字符或空格时使用括号表示法
3. 数组访问
- 所有元素:
$[*]
或$.array[*]
- 指定索引:
$[0]
计数是从0开始 - 范围:
$[1 to 3]
(mysql 8.0.26+)
4. 通配符
*
匹配当前层级所有成员/元素**
递归搜索所有路径(mysql 8.0.26+)
特殊语法元素
1. 过滤表达式 (mysql 8.0.4+)
$.items[?(@.price > 10)]
?
引入过滤表达式
@
表示当前元素
2. 路径范围 (mysql 8.0.26+)
$[1 to 3] // 第1到第3个元素 $[last-1] // 倒数第二个元素 $[last-2 to last] // 最后三个元素
实际示例
简单路径
-- 提取标量值 select json_extract('{"name": "张三", "age": 30}', '$.name'); -- 数组元素, 输出 "b", 注意是带双引号的 select json_extract('["a", "b", "c"]', '$[1]');
复杂路径
-- 嵌套对象 select json_extract('{"store": {"book": {"title": "mysql指南"}}}', '$.store.book.title'); -- 对象数组 select json_extract('{"items": [{"id": 1}, {"id": 2}]}', '$.items[*].id');
简写操作符
mysql 提供常用操作的简写形式
->
: 等同于json_extract()
-
->>
: 等同于json_unquote(json_extract())
-- 以下两种写法等价: select json_column->'$.name'; select json_extract(json_column, '$.name'); -- 以下两种写法等价(返回去除引号的字符串): select json_column->>'$.name'; select json_unquote(json_extract(json_column, '$.name'));
注意
- 路径表达式区分大小写
- 不存在的路径返回 null(不会报错)
**
递归操作符可能影响性能- 过滤表达式支持比较运算符:
=
、!=
、<
、>
等
mysql 的 json_table 函数
使用过 json_extract 函数都知道, 这样获取的结果还不是真正的行列结构, mysql 8.0 引入的 json_table 函数可以将 json 数据转换为关系型表格格式, 将数组中的每个元素转换成表格中的一行数据.
json_table 的功能
- 将 json 数组展开为多行记录
- 提取嵌套的 json 对象属性
- 将半结构化数据转为结构化数据
json_table 用法
json_table( json_doc, -- json 类型的字段或值 path_expression -- json 路径表达式 columns( -- 新表的列定义 column_name column_type path json_path [on_empty] [on_error], ... ) ) [as] alias
参数说明
- json_doc:可以是 json 字符串字面量, 或者表中的 json 类型列
- path_expression:指向要展开的 json 数组的路径
- columns:定义输出列的结构
column_name
:生成的列名column_type
:数据类型(如 varchar, int, json 等)path
:指定数据提取路径- alias:必须提供的表别名
实际案例
将整数数组展开为一列多行
select * from json_table( '[1, 2, 3]', '$[*]' columns( rowid for ordinality, value int path '$' ) ) as t;
输出
rowid | value
------+-------
1 | 1
2 | 2
3 | 3
将对象数组展开为多列多行
select * from json_table( '[{"name":"张三","age":25},{"name":"李四","age":30}]', '$[*]' columns( name varchar(20) path '$.name', age int path '$.age', adult varchar(3) path '$.age' default '否' on empty ) ) as t;
输出
name | age | adult
-----+-----+------
张三 | 25 | 否
李四 | 30 | 否
在数据表中展开
如果json是表中的一个字段, 可以使用 table_1 cross join json_table(...)
展开, 例如一个表 v_video 的字段 result 为 json 字段, 需要展开 result 中的一个成员 sequences, 写成sql如下
select e.id, e.match_id, e.result->>'$.id' as json_id, j.tag->>'$.sf' as sf_value, j.tag->>'$.ef' as ef_value, j.tag->>'$.ef' - j.tag->>'$.sf'as duration from v_video e cross join json_table( e.result->'$.sequences', '$[*]' columns ( tag json path '$' ) ) as j on e.match_id = 294
上面的sql, 通过 cross join json_table 将每一行 e.result 字段下的 sequences 数组展开, 每个数组元素成为新字段 tag, 这时候还是一个 json, 然后在select 中通过->>
抽取其中的值, 得到完全展开的一个新表.
高级用法
for ordinality 子句
生成自增的行号列
columns( id for ordinality, ... )
嵌套路径处理
columns( nested path '$.nested_obj' columns( sub_col1 int path '$.prop1', sub_col2 varchar(10) path '$.prop2' ) )
上面的例子用嵌套可以改写为
select j.id, j.sf, j.ef, j.ef - j.sf as duration from v_video e cross join json_table( e.result->'$.sequences', '$[*]' columns ( id for ordinality, nested path '$' columns( ef int path '$.ef', sf int path '$.sf' ) ) ) as j on e.match_id = 294
上面的sql, 通过 nested path ... columns(...)
将展开后数组中的一个json元素进一步展开为多个字段.
错误处理
columns( ef int path '$.ef' null on empty null on error, sf int path '$.sf' default '0' on empty null on error )
格式是
on_empty: {null | default json_string | error} on empty on_error: {null | default json_string | error} on error
注意事项
- mysql 版本要高于8.0
- 路径表达式必须指向 json 数组, 注意是数组
- 必须为结果集指定别名
- 在 from 子句和 join 子句中都可以使用
- 在性能上, 对大数据集使用 json_table 可能较慢, 可以为 json 列创建函数索引提高查询性能
到此这篇关于mysql 中的 json 查询案例详解的文章就介绍到这了,更多相关mysql json 查询内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论