news 2026/4/23 13:28:33

GROUP BY进阶用法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GROUP BY进阶用法

问题重新:
sql语句中使用了GROUP BY wf_cur.REQUESTID, wf_cur.NODEID,为什么还会出用两行相同REQUESTID的记录呢,GROUP BY不就是拿某个字段来分组吗?

GROUP BY 是按你指定的字段组合进行分组的,不是按单个字段。

你的例子:

sql

GROUP BY wf_cur.REQUESTID, wf_cur.NODEID

这意味着:只有 REQUESTID 和 NODEID 都相同的记录才会被分到同一组

实际示例

假设原始数据:

text

REQUESTID NODEID USERID LASTNAME 1001 10 1 张三 1001 10 2 李四 <- 同一组(REQUESTID和NODEID都相同) 1001 20 3 王五 <- 不同组(NODEID不同) 1001 20 4 赵六 <- 同一组 1002 10 5 钱七 <- 不同组(REQUESTID不同)

分组结果:

  1. 组1:REQUESTID=1001, NODEID=10

    • 包含:张三、李四
    • GROUP_CONCAT结果:"张三, 李四"
  2. 组2:REQUESTID=1001, NODEID=20

    • 包含:王五、赵六
    • GROUP_CONCAT结果:"王五, 赵六"
  3. 组3:REQUESTID=1002, NODEID=10

    • 包含:钱七
    • GROUP_CONCAT结果:"钱七"

为什么会出现多行相同REQUESTID?

因为同一个REQUESTID可能有不同的NODEID!

在你的工作流系统中:

  • 一个流程(REQUESTID)会经过多个节点(NODEID)
  • 每个节点可能有不同的处理人
  • 所以同一个REQUESTID会出现在多个不同的节点中

你的数据示例:

text

REQUESTID NODEID 处理人 303364 371 何永刚 303364 372 何永刚, 谢雨芯 <- 节点372 303364 374 韦丹妮, 谢雨芯 <- 节点374(不同节点!) 303364 377 李华妹 <- 节点377(不同节点!)

GROUP BY REQUESTID, NODEID 后,每个(REQUESTID, NODEID)组合成为一行:

text

REQUESTID NODEID names 303364 371 何永刚 303364 372 何永刚, 谢雨芯 303364 374 韦丹妮, 谢雨芯 303364 377 李华妹

对比不同的GROUP BY方式

1. 按REQUESTID和NODEID分组(你的方式)

sql

GROUP BY REQUESTID, NODEID

结果:一个REQUESTID在不同节点会有多行记录

2. 只按REQUESTID分组

sql

GROUP BY REQUESTID

结果:一个REQUESTID只有一行记录,合并所有节点的人员

text

REQUESTID names 303364 何永刚, 何永刚, 谢雨芯, 谢雨芯, 韦丹妮, 李华妹...

3. 只按NODEID分组

sql

GROUP BY NODEID

结果:同一个节点来自不同流程的人员合并

text

NODEID names 372 何永刚(303364), 谢雨芯(303364), 张三(其他流程), 李四(其他流程)...

验证SQL

运行这个来查看实际的分组情况:

sql

-- 查看每个REQUESTID有多少个不同的NODEID SELECT REQUESTID, COUNT(DISTINCT NODEID) AS node_count, GROUP_CONCAT(DISTINCT NODEID ORDER BY NODEID) AS node_list, COUNT(DISTINCT USERID) AS user_count FROM workflow_currentoperator WHERE ISREMARK IN (0, 4) AND REQUESTID IN ('303364', '303365', '303366') -- 你的示例REQUESTID GROUP BY REQUESTID ORDER BY REQUESTID;

根据需求选择正确的GROUP BY

场景1:想要每个流程每个节点的处理人列表(你现在的需求)

sql

-- 正确:显示流程在每个节点上的处理人 SELECT REQUESTID, NODEID, GROUP_CONCAT(DISTINCT LASTNAME ORDER BY LASTNAME SEPARATOR ', ') AS node_handlers FROM workflow_currentoperator wf_cur INNER JOIN hrmresource zper ON wf_cur.USERID = zper.ID WHERE wf_cur.ISREMARK IN (0, 4) GROUP BY REQUESTID, NODEID;

场景2:想要每个流程的所有处理人(合并所有节点)

sql

-- 合并流程的所有处理人(不管在哪个节点) SELECT REQUESTID, GROUP_CONCAT(DISTINCT LASTNAME ORDER BY LASTNAME SEPARATOR ', ') AS all_handlers, COUNT(DISTINCT NODEID) AS total_nodes FROM workflow_currentoperator wf_cur INNER JOIN hrmresource zper ON wf_cur.USERID = zper.ID WHERE wf_cur.ISREMARK IN (0, 4) GROUP BY REQUESTID;

场景3:想要每个节点的所有处理人(合并所有流程)

sql

-- 查看每个节点有哪些人在处理(来自不同流程) SELECT NODEID, GROUP_CONCAT( DISTINCT CONCAT(LASTNAME, '(', REQUESTID, ')') ORDER BY LASTNAME SEPARATOR ', ' ) AS handlers_by_process, COUNT(DISTINCT REQUESTID) AS process_count FROM workflow_currentoperator wf_cur INNER JOIN hrmresource zper ON wf_cur.USERID = zper.ID WHERE wf_cur.ISREMARK IN (0, 4) GROUP BY NODEID;

总结

GROUP BY REQUESTID, NODEID 的结果是正常的!

  • 同一个REQUESTID + 不同的NODEID = 不同的分组
  • 这反映了工作流的真实情况:一个流程会经过多个节点
  • 每个节点可能有不同的处理人

如果你想要每个REQUESTID只显示一行,应该用GROUP BY REQUESTID
但根据你的数据,同一个REQUESTID在不同节点确实有不同的处理人,所以显示多行是正确的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:23:52

Xiaomi MiMo-V2-Flash 开源:高效推理、代码与 Agent 基座模型

Xiaomi MiMo-V2-Flash 是小米专为极致推理效率自研的总参数 309B&#xff08;激活15B&#xff09;的 MoE 模型&#xff0c;通过引入 Hybrid 注意力架构创新 及 多层 MTP 推理加速&#xff0c;在多个 Agent 测评基准上进入全球开源模型 Top 2&#xff1b;代码能力超过所有开源模…

作者头像 李华
网站建设 2026/4/22 6:10:37

VSCode 配置 C++ 开发环境(Windows+Linux 双平台)

前言作为大二计科生&#xff0c;是不是还在为 C 开发环境配置头疼&#xff1f;Dev-C 功能太简陋&#xff0c;Visual Studio 体积太大&#xff0c;VSCode 凭借轻量、跨平台、插件丰富的优势&#xff0c;成为很多程序员的首选。本文详细讲解 Windows 和 Linux 平台下 VSCode 的 C…

作者头像 李华
网站建设 2026/4/23 13:05:13

自定义Bean Validation注解并自定义校验逻辑

自定义校验注解 实现自定义校验注解&#xff0c;本质上是遵循 JSR-303/JSR-380 (Bean Validation) 规范。 在 Spring Boot 中实现它&#xff0c;只需要 两步走&#xff1a; 定义注解&#xff08;接口&#xff09;&#xff1a;相当于制定法律条款。定义校验器&#xff08;实现…

作者头像 李华
网站建设 2026/4/19 9:57:53

深度学习框架实战:TensorFlow与PyTorch的对比与选择指南

摘要随着人工智能技术的快速发展&#xff0c;深度学习框架已成为开发者必备的工具。本文将从实际应用角度出发&#xff0c;深入对比TensorFlow和PyTorch两大主流框架&#xff0c;帮助开发者根据具体需求做出明智选择&#xff0c;并附上实战代码示例。引言在当今AI技术爆炸式发展…

作者头像 李华
网站建设 2026/4/19 10:45:36

【MongoDB实战】7.2 事务实战:转账场景数据一致性保证(完整实操代码)

文章目录 《MongoDB实战入门》7.2 事务实战:转账场景数据一致性保证(完整实操代码) 一、前置说明:MongoDB事务的核心前提 二、核心业务场景定义 三、Node.js版本实战代码(基于mongodb驱动5.x) 1. 安装依赖 2. 完整实操代码 3. 运行结果说明 四、Python版本实战代码(基于…

作者头像 李华
网站建设 2026/4/21 21:54:51

Zookeeper及Kafka

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 前言 一、Zookeeper 1.Zookeeper简介 2.Zookeeper 工作机制 3.Zookeeper 数据结构 4.Zookeeper 应用场景 5.Zookeeper 选举机制 6.部署 Zookeeper 集群 二、Kaf…

作者头像 李华