news 2026/2/18 4:22:14

数据、数据库分类

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
数据、数据库分类

1、概述

  • 数据库主要分为关系型数据库(如MySQL、Oracle)和非关系型数据库(NoSQL,如MongoDB、Redis),其中NoSQL又包括键值存储、文档数据库、列存储、图数据库等类型。
  • 数据则分为结构化数据(如表格数据)、半结构化数据(如JSON、XML)和非结构化数据(如文本、图像、视频)。

2、数据库的主要类型

数据库的分类维度较多,主流是按数据模型划分,不同类型的数据库针对不同的数据存储和访问场景设计,核心类型如下:

关系型数据库(RDBMS)

  • 核心特点:基于关系模型(二维表结构),数据以行(记录)和列(字段)的形式存储,遵循 ACID(原子性、一致性、隔离性、持久性)原则,支持 SQL(结构化查询语言),强调数据的一致性和完整性。
  • 典型产品:MySQL、Oracle、PostgreSQL、SQL Server。
  • 适用场景:需要事务支持、数据强一致性、结构化查询的场景。

非关系型数据库(NoSQL)

这类数据库不依赖传统的关系模型,为应对大规模、高并发、非结构化 / 半结构化数据场景而生,主要分为以下子类:

子类核心特点典型产品核心场景
键值型数据库以 “键 - 值” 对存储数据,查询速度极快Redis、Memcached缓存、会话存储、计数器、实时推荐
文档型数据库存储半结构化的文档(如 JSON/BSON 格式),支持嵌套结构MongoDB、CouchDB内容管理系统、电商商品数据、用户画像
列族型数据库按列存储数据,适合批量列查询,扩展性强HBase、Cassandra大数据分析、日志存储、时序数据
图形数据库以节点和边存储数据,专注处理实体间的关系Neo4j、ArangoDB社交网络关系、知识图谱、路径规划

新型数据库

  • 时序数据库:专为时间戳关联的数据设计,支持高吞吐写入和按时间范围的快速查询,典型产品:InfluxDB、TimescaleDB,适用于物联网传感器数据、监控指标、金融交易流水。
  • 向量数据库:存储和检索向量数据(如 AI 模型生成的嵌入向量),支持相似度计算,典型产品:Milvus、Pinecone,适用于图像 / 文本检索、推荐系统、大模型知识库。

3、数据的主要类型

数据结构和业务属性划分,数据可分为以下几类,与数据库类型的匹配是选型的核心逻辑。

结构化数据

  • 定义:数据格式固定、有明确的结构,可直接映射为二维表的行和列。
  • 示例:用户 ID、订单编号、商品价格、出生日期、性别。
  • 适合的数据库关系型数据库(如 MySQL、Oracle)。
  • 匹配逻辑:结构化数据的强规范性与关系型数据库的表结构、约束(主键、外键、唯一性约束)高度契合,SQL 查询能高效完成多表关联、聚合分析。

半结构化数据

  • 定义:数据有一定结构,但结构不固定或可扩展,支持嵌套和灵活字段。
  • 示例:JSON 格式的用户信息(含基础字段 + 可选的扩展字段)、XML 文档、日志数据。
  • 适合的数据库文档型数据库(如 MongoDB)、部分支持灵活 Schema 的关系型数据库(如 PostgreSQL 的 JSONB 类型)。
  • 匹配逻辑:文档型数据库无需预先定义表结构,可直接存储嵌套的半结构化数据,支持按文档内字段查询,比关系型数据库更灵活。

非结构化数据

  • 定义:无固定格式,无法直接用二维表表示的数据。
  • 示例:图片、音频、视频、PDF 文档、纯文本日志、自然语言文本。
  • 适合的数据库
    • 直接存储:对象存储(如阿里云 OSS、AWS S3)+ 元数据存储(关系型 / 文档型数据库);
    • 检索分析:若需提取特征或检索,可结合向量数据库(如 Milvus,将非结构化数据转为向量后存储)。
  • 匹配逻辑:非结构化数据体积大、结构无规律,传统数据库难以高效存储和检索,对象存储负责低成本海量存储,元数据 / 向量数据库负责管理检索维度。

时序数据

  • 定义:与时间强关联、按时间顺序产生的连续数据,具有高写入、高查询频率的特点。
  • 示例:服务器 CPU 使用率、物联网设备的温度读数、股票价格波动、用户行为日志。
  • 适合的数据库时序数据库(如 InfluxDB、TimescaleDB)、列族型数据库(如 HBase)。
  • 匹配逻辑:时序数据库针对时间维度做了特殊优化,支持按时间范围的快速聚合查询,比关系型数据库的写入和查询效率高 10 倍以上。

关系型数据

  • 定义:核心价值在于实体之间的关联关系,而非单个实体的数据本身。
  • 示例:社交网络中用户的关注关系、知识图谱中 “疾病 - 症状 - 药物” 的关联、地图中的 “地点 - 路线 - 交通方式” 关系。
  • 适合的数据库图形数据库(如 Neo4j)。
  • 匹配逻辑:关系型数据库查询多实体关联时需多次多表 Join,效率极低;图形数据库以节点和边直接存储关系,查询 “用户的好友的好友” 这类多层关系时,速度远超传统数据库。

4、数据类型与数据库类型的匹配总结表

数据类型推荐数据库类型典型应用场景
结构化数据关系型数据库(MySQL/Oracle)电商订单系统、银行交易系统、ERP 系统
半结构化数据文档型数据库(MongoDB)内容管理系统、用户画像、配置数据
非结构化数据对象存储 + 元数据 / 向量数据库图片 / 视频存储、文档检索、大模型知识库
时序数据时序数据库(InfluxDB)监控系统、物联网数据、金融流水
关系型数据图形数据库(Neo4j)社交网络、知识图谱、路径规划
高频读写的小数据键值型数据库(Redis)缓存、计数器、会话存储

参考文档:

https://xixingzhe.blog.csdn.net/article/details/149279707?spm=1011.2415.3001.5331

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/6 7:10:59

EmotiVoice语音合成服务容器化部署实践(Docker)

EmotiVoice语音合成服务容器化部署实践(Docker) 在AI驱动的交互时代,用户对语音输出的要求早已超越“能听清”的基本门槛。无论是智能助手、游戏NPC还是数字人直播,机械单调的语音已无法满足沉浸式体验的需求。如何让机器“说话”…

作者头像 李华
网站建设 2026/2/16 19:02:38

为什么越来越多开发者选择EmotiVoice做语音项目?

为什么越来越多开发者选择 EmotiVoice 做语音项目? 在虚拟主播直播中突然“破防”大笑,在游戏NPC对话里流露出压抑的愤怒,或是有声书中娓娓道来时那一丝不易察觉的悲伤——这些曾只能靠真人配音实现的情感张力,如今正被一个开源工…

作者头像 李华
网站建设 2026/2/10 2:39:49

用EmotiVoice生成广告旁白:转化率提升的秘密武器

用EmotiVoice生成广告旁白:转化率提升的秘密武器 在短视频广告满天飞的今天,你有没有发现——有些广告一听就想划走,而另一些却能牢牢抓住你的耳朵?背后的关键,可能不是文案多精彩,而是声音的情绪感染力。 …

作者头像 李华
网站建设 2026/2/17 18:42:28

13、网络分析与文化领域分析实践

网络分析与文化领域分析实践 1. 提取块命名 从数据科学的角度来看,宏观层面的网络分析(如提取社区、派系和其他结构块)属于无监督机器学习的范畴。无监督机器学习的目标是在没有“标签”(节点和边的属性,可能除了边的权重)的情况下推断网络的隐藏结构。 然而,挖掘出的…

作者头像 李华
网站建设 2026/2/7 8:07:02

6、Linux命令实用技巧全解析

Linux命令实用技巧全解析 在Linux系统的使用中,掌握各种命令的使用方法和技巧能够极大地提高工作效率。本文将详细介绍一些常用的Linux命令及其应用场景,帮助大家更好地利用Linux系统。 信息搜索与导航命令 在使用Info系统时,我们可以通过一些快捷键来进行文本搜索和获取…

作者头像 李华