hive 列转行—collect_set()/collect_list()/concat_ws()函数的使用场景_MsSqlserver

文章目录

一、collect_set()/collect_list():
二、实际运用
例子
总结

一、collect_set()/collect_list():

在 hive 中想实现按某字段分组，对另外字段进行合并，可通过collect_list()或者collect_set()实现。

collect_set()函数与collect_list()函数：列转行专用函数，都是将分组中的某列转为一个数组返回。有时为了字段拼接效果，多和concat_ws()函数连用。
collect_set()与collect_list()的区别：

二、实际运用

1、创建测试表及插入数据 :

drop table test_1;
create table test_1(
id string,
cur_day string,
rule string
) 
row format delimited fields terminated by ',';

insert into test_1 values
('a','20230809','501'),('a','20230811','502'),('a','20230812','503'),('a','20230812','501'),('a','20230813','512'),('b','20230809','511'),('b','20230811','512'),('b','20230812','513'),('b','20230812','511'),('b','20230813','512'),('b','20230809','511'),('c','20230811','512'),('c','20230812','513'),('c','20230812','511'),('c','20230813','512');

把同一分组的不同行的数据聚合成一个行

举例1：按照id，cur_day分组，取出每个id对应的所有rule（不去重）。

select id,cur_day,collect_list(rule) as rule_total  from test_1 group by id,cur_day order by id,cur_day;

在这里插入图片描述

举例2：按照id，cur_day分组，取出每个id对应的所有rule（去重）。

select id,cur_day,collect_set(rule) as rule_total from test_1 group by id,cur_day order by id,cur_day;

set去重

用下标可以随机取某一个

select id,cur_day,collect_list(rule)[0] as rule_one from test_1 group by id,cur_day order by id,cur_day;

select id,cur_day,collect_set(rule)[0] as rule_one from test_1 group by id,cur_day order by id,cur_day;

在这里插入图片描述

聚合后的中的值用‘|’分隔开

select id,cur_day,concat_ws('|',collect_list(rule)) as rule_total from test_1 group by id,cur_day order by id,cur_day;

select id,cur_day,concat_ws('|',collect_set(rule)) as rule_total from test_1 group by id,cur_day order by id,cur_day;

在这里插入图片描述

例子

spark-sql : collect_list里边字段起别名.(as等其他方式都用过,都报错.
最后用子查询来解决)

select fencecode,
       collect_list(struct(vehicleno, platecolor, entertime, levaetime, trans)) as actinfos
from (
    select fence_code as fencecode,
           veh_no as vehicleno,
           veh_color as platecolor,
           enter_time as entertime,
           out_time as levaetime,
           trans
    from mid.ct_fence_into_out_dt where dt = 20230911  
) subquery
group by fencecode;

总结

SQLServer2022新特性Window子句的使用

参考官方文档https://learn.microsoft.com/zh-cn/sql/t-sql/queries/select-window-transact... [阅读全文]

SQLServer 表值构造函数(Transact-SQL)的使用

在 sql server 中，表值构造函数（table value constructor, tvc）是一种用于在单个语句中插入多行数据到表中的语法。它允许你以行内表值表达式（ro…

2024年08月05日 • 数据库

SQLServer中MERGE语句的使用

在 sql server 中，merge 语句用于根据两个表之间的条件来插入、更新或删除记录。它通常用于同步两个表的数据，其中一个表是源表（包含要插入或更新的数据），另一个是目标表…

2024年08月05日 • 数据库

SQLServer OUTPUT子句的具体使用

在 sql server 中，output 子句允许你捕获由 insert、update 或 delete 语句影响的行，并将这些行作为结果集返回。这对于需要同时获取修改的行和执行…

2024年08月05日 • 数据库

CnosDB 元数据集群 – 分布式时序数据库的大脑

CnosDB 是一个分布式时序数据库系统，其中元数据集群是核心组件之一，负责管理整个集群的元数据信息。 CnosDB 元数据集群 – 分布式时序数据库的大脑 1... [阅读全文]

Flink读取kafka主题，并写入hbase

是版本号错误 flink-sql-connector-hbase-2.2-1.17.2.jar 1.17.2与flink版本号不对。hbase(main):014:0>…

2024年08月05日 • 数据库


验证码：

验证码：

hive 列转行—collect_set()/collect_list()/concat_ws()函数的使用场景

2024年08月04日 • MsSqlserver •我要评论

文章目录

一、collect_set()/collect_list():

二、实际运用

1、创建测试表及插入数据 :

举例1：按照id，cur_day分组，取出每个id对应的所有rule（不去重）。

举例2：按照id，cur_day分组，取出每个id对应的所有rule（去重）。

例子

总结

相关文章:

SQLServer 表值构造函数(Transact-SQL)的使用

SQLServer中MERGE语句的使用

SQLServer OUTPUT子句的具体使用

Flink读取kafka主题，并写入hbase

发表评论