Apache Kafka简介

kafka入门教程轻松学

第一章 Kafka简介

kafka的定位

提到kafka,不太熟悉或者稍有接触的开发人员,第一想法可能会觉得它是一个消息系统。其实Kafka的定位并不止于此。

Kafka官方文档介绍说,Apache Kafka是一个分布式流平台,并给出了如下解释:

流平台有三个关键的能力:

发布订阅记录流,和消息队列或者企业新消息系统类似。 以可容错、持久的方式保存记录流 当记录流产生时就进行处理 Kafka通常用于应用中的两种广播类型:

在系统和应用间建立实时的数据管道,能够可信赖的获取数据。 建立实时的流应用,可以处理或者响应数据流。 由此可见,kafka给自身的定位并不只是一个消息系统,而是通过发布订阅消息这种机制实现了流平台。

其实不管kafka给自己的定位如何,他都逃脱不了发布订阅消息的底层机制。本文讲解的重点,也是kafka发布订阅消息的特性。

Kafka和大多数消息系统一样,搭建好kafka集群后,生产者向特定的topic生产消息,而消费者通过订阅topic,能够准实时的拉取到该topic新消息,进行消费。如下图: ​​ introduction.jpeg

Kafka特性

kafka和有以下主要的特性:

  1. 消息持久化
  2. 高吞吐量
  3. 可扩展性

尤其是高吞吐量,是他的最大卖点。kafka之所以能够实现高吞吐量,是基于他自身优良的设计,及集群的可扩展性。后面章节会展开来分析。

Kafka应用场景

  1. 消息系统
  2. 日志系统
  3. 流处理

小结:通过本章学习,可以掌握kafka的定位及其特性,了解消息系统的基本运作方式。以及kafka的应用场景。下面一章我们将通过安装和使用kafka,对kafka有近一步直观的认知。

All rights reserved
Except where otherwise noted, content on this page is copyrighted.