news 2026/1/10 20:42:54

Kafka四部曲之一:Kafka的核心概念

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Kafka四部曲之一:Kafka的核心概念

文章目录

  • 核心概念
    • 部署交互架构
    • 数据逻辑模型

核心概念

Kafka是一个事件流平台, 结合了三大关键功能:

  • 发布(写入)和订阅(读取)事件流,包括从其他系统持续导入/导出数据。
  • 持久可靠地存储事件流,存储时间长短随您所需。
  • 对正在发生的事件流进行处理,或进行回顾性处理。

并且所有这些功能都以分布式、高度可扩展、弹性、容错和安全的方式提供。

事件流是指:

  • 从数据库、传感器、移动设备、云服务和软件应用程序等事件源实时捕获数据,并将这些数据以事件流的形式存储起来;
  • 将这些事件流持久化存储以便后续检索;
  • 实时以及回顾性地操作、处理和响应这些事件流;

并根据需要将事件流路由到不同的目标技术。因此,事件流能够确保数据的持续流动和解读,从而保证在正确的时间将正确的信息传递到正确的位置。

部署交互架构

Kafka由服务器和客户端组成,并通过TCP网络协议进行通信:

  • 服务端:Kafka 以集群形式运行,集群由一个或多个服务器组成。其中一些服务器构成存储层,称为Broker;其他服务器运行Kafka Connect,以事件流的形式持续导入和导出数据,从而将 Kafka 与您现有的系统(例如关系数据库)以及其他 Kafka 集群集成。
  • 客户端:它们允许您编写分布式应用程序和微服务,以并行、大规模且容错的方式读取、写入和处理事件流,即使在网络问题或机器故障的情况下也能正常运行。

数据逻辑模型

  • 事件:事件记录了世界上或您的业务中“发生了某些事情”这一事实(也被称为记录或消息)。当您向 Kafka 读取或写入数据时,您是以事件的形式进行的。从概念上讲,事件包含键、值、时间戳和可选的元数据标头。
  • 生产者:生产者是向 Kafka 发布(写入)事件的客户端应用程序。
  • 消费者:消费者则是订阅(读取和处理)这些事件的应用程序。
  • 主题:事件被组织并持久存储在主题中。简单来说,主题类似于文件系统中的文件夹,而事件则是该文件夹中的文件。Kafka 中的主题始终是多生产者和多订阅者的:一个主题可以有零个、一个或多个生产者向其写入事件,也可以有零个、一个或多个消费者订阅这些事件。主题中的事件可以根据需要多次读取,并且事件在被使用后不会被删除,相反,您可以通过每个主题的配置设置来定义 Kafka 应该保留事件的时间,之后旧事件将被丢弃。Kafka 的性能与数据大小几乎无关,因此长时间存储数据完全没有问题。
  • 分区:主题是分区的,这意味着一个主题分布在位于不同 Kafka Broker上的多个“存储桶”中。这种分布式数据放置对于可扩展性至关重要,因为它允许客户端应用程序同时从多个Broker读取和写入数据。当一个新事件发布到主题时,它实际上会被追加到该主题的某个分区中。具有相同事件键(类似标签的概念)的事件会被写入同一个分区,Kafka保证给定主题分区的任何消费者始终会按照写入顺序读取该分区中的事件。

为了确保数据的容错性和高可用性,每个主题都可以进行复制,即使跨越不同的地理区域或数据中心,这样就能保证始终有多个代理服务器拥有数据副本,以应对可能出现的故障、代理服务器维护等情况。常见的生产环境配置是复制因子为 3,也就是说,始终会有三个数据副本。这种复制是在主题分区级别执行的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/9 11:41:51

Java 后端接入大模型 API 遇到的问题

背景:公司平台要加一个客服功能,我选了deepseek,便宜稳定,测试环境没问题,上线后高峰期系统变慢,监控一看tomcat连接池用满了,排查发现AI流式请求高峰期20个并发,每个占连接15秒,需要300个连接,但连接池只有200个,而且跟业务请求公用,AI请求把连接池占满,业务请求进不来,测试环…

作者头像 李华
网站建设 2026/1/9 11:41:30

企业级解决方案:基于Llama Factory的大模型开发平台

企业级解决方案:基于Llama Factory的大模型开发平台 在大模型技术快速发展的今天,如何高效地构建一个标准化的大模型开发平台,成为许多技术团队面临的挑战。本文将介绍如何利用Llama Factory这一开源框架,搭建一个可扩展、易管理的…

作者头像 李华
网站建设 2026/1/9 11:41:20

AI语音技术演进路线:从单一音色到情感化表达的关键突破

AI语音技术演进路线:从单一音色到情感化表达的关键突破 从机械朗读到情感共鸣:中文语音合成的技术跃迁 早期的语音合成系统(Text-to-Speech, TTS)大多停留在“能说”的阶段,输出的语音虽然可懂,但语调平直、…

作者头像 李华
网站建设 2026/1/9 11:40:21

AO3创作者福音:小说文本一键转语音朗读

AO3创作者福音:小说文本一键转语音朗读 📖 项目背景与核心价值 对于AO3(Archive of Our Own)平台上的同人小说创作者而言,长时间阅读、校对和分享作品是一项极具挑战的任务。尤其是面对大段文字时,视觉疲劳…

作者头像 李华
网站建设 2026/1/9 11:38:49

CRNN OCR在司法领域的应用:法律文书自动识别系统

CRNN OCR在司法领域的应用:法律文书自动识别系统 📖 技术背景与行业痛点 在司法信息化建设不断推进的今天,海量纸质法律文书的数字化处理已成为法院、律所、公证机构等单位的核心需求。传统的人工录入方式不仅效率低下(平均每人每…

作者头像 李华
网站建设 2026/1/9 11:38:43

网络安全的相关比赛有哪些?需要掌握哪些必备技能?

01 CTF(夺旗赛) 这是一种最常见的网络安全竞技形式,要求参赛者在限定时间内解决一系列涉及密码学、逆向工程、漏洞利用、取证分析等领域的挑战,获取标志(flag)并提交得分。 通过举办CTF来培养网络安全人才…

作者头像 李华