0%

Kafka概念

Kafka概念

1. 介绍

Apache kafka是消息中间件的一种,我发现很多人不知道消息中间件是什么,在开始学习之前,我这边就先简单的解释一下什么是消息中间件,只是粗略的讲解,目前kafka已经可以做更多的事情。

举个例子,生产者消费者,生产者生产鸡蛋,消费者消费鸡蛋,生产者生产一个鸡蛋,消费者就消费一个鸡蛋,假设消费者消费鸡蛋的时候噎住了(系统宕机了),生产者还在生产鸡蛋,那新生产的鸡蛋就丢失了。再比如生产者很强劲(大交易量的情况),生产者1秒钟生产100个鸡蛋,消费者1秒钟只能吃50个鸡蛋,那要不了一会,消费者就吃不消了(消息堵塞,最终导致系统超时),消费者拒绝再吃了,”鸡蛋“又丢失了,这个时候我们放个篮子在它们中间,生产出来的鸡蛋都放到篮子里,消费者去篮子里拿鸡蛋,这样鸡蛋就不会丢失了,都在篮子里,而这个篮子就是”kafka“。

鸡蛋其实就是“数据流”,系统之间的交互都是通过“数据流”来传输的(就是tcp、https什么的),也称为报文,也叫“消息”。

消息队列满了,其实就是篮子满了,”鸡蛋“ 放不下了,那赶紧多放几个篮子,其实就是kafka的扩容。

各位现在知道kafka是干什么的了吧,它就是那个”篮子”。

2. 名词解释

  1. 从业务角度

    1. producer:生产者,就是它来生产“鸡蛋”的。

    2. consumer:消费者,生出的“鸡蛋”它来消费。

    3. topic:你把它理解为标签,生产者每生产出来一个鸡蛋就贴上一个标签(topic),消费者可不是谁生产的“鸡蛋”都吃的,这样不同的生产者生产出来的“鸡蛋”,消费者就可以选择性的“吃”了。

    4. broker:就是篮子了。

  2. 从技术角度

    1. producer:发布消息的对象称之为主题生产者(Kafka topic producer)。

    2. consumer:订阅消息并处理发布的消息的种子的对象称之为主题消费者(consumers)。

    3. topic:Kafka将消息种子(Feed)分门别类,每一类的消息称之为一个主题(Topic)。每一类业务数据要从不同的主题下拿取。

    4. broker:已发布的消息保存在一组服务器中,称之为Kafka集群。集群中的每一个服务器都是一个代理(Broker). 消费者可以订阅一个或多个主题(topic),并从Broker拉数据,从而消费这些已发布的消息。

3. 主要应用于以下两方面

  1. 构建实时的流数据管道,可靠地获取系统和应用程序之间的数据。

  2. 构建实时流的应用程序,对数据流进行转换或反应。

4. 几个概念

  1. kafka作为一个集群运行在一个或多个服务器上。

  2. kafka集群存储的消息是以topic为类别记录的。

  3. 每个消息(也叫记录record,我习惯叫消息)是由一个key,一个value和时间戳构成。

5. 四个核心 API

核心API

  1. 应用程序使用 Producer API 发布消息到1个或多个 topic(主题)。

  2. 应用程序使用 Consumer API 来订阅一个或多个 topic,并处理产生的消息。

  3. 应用程序使用 Streams API 充当一个流处理器,从1个或多个 topic 消费输入流,并生产一个输出流到1个或多个输出 topic,有效地将输入流转换到输出流。

  4. Connector API 允许构建或运行可重复使用的生产者或消费者,将 topic 连接到现有的应用程序或数据系统。例如,一个关系数据库的连接器可捕获每一个变化。