在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
Kafka是由Java编写的一个开源流处理平台,因为它强大的动作流数据处理功能而备受大数据开发者的欢迎。因而作为大数据的开发者,掌握Kafka也就掌握了大数据最重要的一项核心技术。本文是一篇新手入门Kafka的安装教程,下面小编将手把手结合图片详细的指导大家安装Kafka。
1、认识Kafka
Kakfa 是一个分布式的基于发布/订阅模式的消息队列(message queue),所谓的消息队列是指一个用户要注册信息,当用户信息写入数据库后,后面还有一些其他流程,比如发送短信,则需要等这些流程处理完成后,再返回给用户。Kafka 的基础架构主要有 broker、生产者、消费者组构成,当前还包括 ZooKeeper。目前Kakfa主要应用于大数据的实时处理领域。
2、 安装 Kafka
步骤一:Kafka 的安装只需要解压安装包就可以完成安装。
tar -zxvf kafka_2.11-2.1.1.tgz -C /usr/local/
步骤二: 查看配置文件。
[root@es1 config]# pwd
/usr/local/kafka/config
[root@es1 config]# ll
total 84
-rw-r--r--. 1 root root 906 Feb 8 2019 connect-console-sink.properties
-rw-r--r--. 1 root root 909 Feb 8 2019 connect-console-source.properties
-rw-r--r--. 1 root root 5321 Feb 8 2019 connect-distributed.properties
-rw-r--r--. 1 root root 883 Feb 8 2019 connect-file-sink.properties
-rw-r--r--. 1 root root 881 Feb 8 2019 connect-file-source.properties
-rw-r--r--. 1 root root 1111 Feb 8 2019 connect-log4j.properties
-rw-r--r--. 1 root root 2262 Feb 8 2019 connect-standalone.properties
-rw-r--r--. 1 root root 1221 Feb 8 2019 consumer.properties
-rw-r--r--. 1 root root 4727 Feb 8 2019 log4j.properties
-rw-r--r--. 1 root root 1925 Feb 8 2019 producer.properties
-rw-r--r--. 1 root root 6865 Jan 16 22:00 server-1.properties
-rw-r--r--. 1 root root 6865 Jan 16 22:00 server-2.properties
-rw-r--r--. 1 root root 6873 Jan 16 03:57 server.properties
-rw-r--r--. 1 root root 1032 Feb 8 2019 tools-log4j.properties
-rw-r--r--. 1 root root 1169 Feb 8 2019 trogdor.conf
-rw-r--r--. 1 root root 1023 Feb 8 2019 zookeeper.properties
(3)修改配置文件 server.properties。
设置 broker.id 这个是 Kafka 集群区分每个节点的唯一标志符。
步骤三:设置 Kafka 的数据存储路径。
步骤四:设置是否可以删除 topic,默认 Kafka 的 topic 是不允许删除的。
步骤五:Kafka 的数据保留的时间,默认是 7 天。
步骤六:Log 文件最大的大小,如果 log 文件超过 1 G 会创建一个新的文件。
步骤七:Kafka 连接的 ZooKeeper 的地址和连接 Kafka 的超时时间。
步骤八:默认的 partition 的个数。
步骤九:安装成功,启动 Kafka,每个 Kakfa 节点都需要手动启动,下面的方式阻塞的方式启动。
如何安装Kafka?相信大家看完新手安装Kafka教程指导,对于这个问题应该已经有了自己的答案。当然安装Kafka只是第一步,要想更加深入学习大数据的相关技术,可以来博学谷报名相关课程。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
经典数据分析应用介绍
大数据时代的到来,促使互联网更加高速的发展。也为互联网创造了更多的岗位。我们耳熟能详的就是大数据在电商平台、搜索平台的应用,通过大数据分析,为我们提供了更加便利的服务。那还有哪些景点的数据分析应用案例呢?
7729
2019-07-01 19:04:24
用户画像是什么?可以用来做什么?
用户画像是什么?可以用来做什么?一般是指通过可收集到的用户信息,分析出比较标签化的用户模型。在当下这个大数据时代,用户画像可以提供更精准的个性化服务给用户。因此用户画像的成本虽然高,但各大企业公司还是在不遗余力的去做,就足以瞥见用户画像的强大功能。
10469
2019-10-24 11:13:14
大数据笔记之分布式文件存储系统
现在是大数据的时代,也是数据爆炸的时代,如何处理大数据的存储成为了摆在人们面前的难题,因此分布式文件存储系统应用而生。同时分布式文件存储系统在大数据面试中,也是一个常常可以见到的考点之一。本文为大家梳理了相关的大数据知识点,感兴趣的小伙伴可以看一看。
6421
2019-11-05 16:26:09
什么叫大数据时代?它有哪些特点?
随着互联网技术和信息技术的发展,大数据在金融、资讯、娱乐、电商等等行业被广泛地应用,因此毫不夸张地说,我们已经全面迎来了一个大数据的时代。虽然我们常常提起大数据,但其实对于大数据时代的理解还仍旧比较浅显。本文将从大数据时代的特点、海量的数据处理以及面对的挑战,来和大家好好聊聊大数据时代。
9995
2020-06-02 15:07:21
Pandas如何分块处理大文件?
在处理快手的用户数据时,碰到600M的txt文本,用sublime打开蹦了,用pandas.read_table()去读竟然花了小2分钟,打开有3千万行数据。仅仅是打开,要处理的话不知得多费劲。解决方法:读取文件的函数有两个参数:chunksize、iterator。原理分多次不一次性把文件数据读入内存中。
5627
2020-08-14 16:16:47