news 2026/2/15 10:18:56

hive sql行转列,列转行sql的实例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
hive sql行转列,列转行sql的实例

在 Hive SQL 中,行转列和列转行是常见的数据转换操作。以下是详细说明和示例:

一、行转列(多行转多列)

场景:将同一分组下的多行数据合并为单行,不同值转为新列(如学生各科成绩横向展示)。

数据示例(student_scores):

student_idsubjectscore
1Math90
1English85
2Math92

目标(每个学生一行,科目成绩转为列):

student_idMathEnglish
19085
292NULL

SQL 实现

SELECT student_id, MAX(CASE WHEN subject = 'Math' THEN score END) AS Math, MAX(CASE WHEN subject = 'English' THEN score END) AS English FROM student_scores GROUP BY student_id;

关键点

  1. 使用CASE WHEN按条件生成新列
  2. 用聚合函数(如MAX/MIN/SUM)确保单行输出
  3. 必须配合GROUP BY分组字段

二、列转行(多列转多行)

场景:将单行的多列数据拆分为多行(如将横向科目成绩转为纵向记录)。

数据示例(student_scores_wide):

student_idMathEnglish
19085
292NULL

目标(恢复为行式存储):

student_idsubjectscore
1Math90
1English85
2Math92
2EnglishNULL

SQL 实现

SELECT student_id, 'Math' AS subject, Math AS score FROM student_scores_wide UNION ALL SELECT student_id, 'English' AS subject, English AS score FROM student_scores_wide;

优化方案(使用LATERAL VIEW explode(),Hive 特有):

SELECT student_id, subject, score FROM student_scores_wide LATERAL VIEW explode( map( -- 构建科目-分数的键值对 'Math', Math, 'English', English ) ) subjects AS subject, score;

关键点

  1. UNION ALL适合列数量固定的场景
  2. LATERAL VIEW + explode(map)动态处理多列
  3. 注意处理NULL值(Hive 中NULL会正常保留)

三、高级用法:动态行列转换

当列名不固定时(如新增科目),需结合 Hive 动态 SQL 或预处理:

  1. 行转列动态化
    使用collect_list+ 拼接字符串,再通过 UDF 解析(较复杂,通常需借助外部脚本生成 SQL)。
  2. 列转行动态化
    通过 Hive 元数据获取列名,动态生成UNION ALL语句(示例略,需依赖 Hive 变量或编程接口)。

总结对比

操作核心方法适用场景
行转列CASE WHEN+ 聚合函数 +GROUP BY固定列名,聚合统计
列转行UNION ALLLATERAL VIEW explode列数量少或需动态处理

提示:Hive 3.0+ 支持LATERAL VIEW inline(array_of_structs),但需先构造结构体数组。实际使用时请根据数据规模和复杂度选择合适方案。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/12 12:04:57

专业服务-健康咨询:在线问诊平台UI测试

UI测试在健康咨询平台的重要性‌ 随着远程医疗的蓬勃发展(截至2026年,全球在线问诊用户超10亿),在线问诊平台已成为医疗服务的核心渠道。然而,其用户界面(UI)的缺陷可能导致误诊、数据泄露或用…

作者头像 李华
网站建设 2026/2/13 7:33:08

从GitHub镜像快速拉取GLM-TTS项目并完成WebUI本地化部署

从GitHub镜像快速拉取GLM-TTS项目并完成WebUI本地化部署 在AI语音技术加速落地的今天,越来越多开发者希望将高质量的语音合成功能集成到自己的产品中。然而,面对动辄数十GB的模型、复杂的依赖关系和晦涩的命令行接口,很多人止步于“看得见却…

作者头像 李华
网站建设 2026/2/11 23:42:38

最新发布的十大毕业论文选题平台排名与选题避坑指南

10大论文选题工具核心对比 排名 工具名称 核心功能 效率评分 适用场景 1 aicheck 智能选题大纲生成 ★★★★★ 完全无头绪时的选题生成 2 aibiye 选题优化可行性分析 ★★★★☆ 已有初步方向的优化调整 3 知网 学术资源库选题参考 ★★★★☆ 专业领域深度…

作者头像 李华
网站建设 2026/2/13 3:02:19

GLM-TTS能否导入外部词典?专业术语发音校正方法

GLM-TTS能否导入外部词典?专业术语发音校正方法 在医疗报告朗读、法律文书播报或金融资讯合成中,你是否曾被AI把“银行”读成“因航”、“行长”念作“行走长者”而感到尴尬?这些看似细小的发音错误,在专业场景下却可能引发误解&…

作者头像 李华