通过与 Jira 对比，让您更全面了解 PingCode

PingCode AI 开始智能化研发管理新时代

首页
需求与产品管理
项目管理
测试与缺陷管理
知识管理
效能度量
研发管理
- - - 更多产品
      
      产品管理
      客户为中心的产品管理工具
      
      项目管理
      专业的软件研发项目管理工具
      
      知识管理
      简单易用的团队知识库管理
      
      效能度量
      可量化的研发效能度量工具
      
      测试管理
      测试用例维护与计划执行
      
      协作空间
      以团队为中心的协作沟通
      
      自动化
      研发工作流自动化工具
      
      目录服务
      账号认证与安全管理工具
      
      Why PingCode
      
      为什么选择 PingCode ？
      
      6000+企业信赖之选，为研发团队降本增效
      
      Jira 对比
      
      产品视频
解决方案
- - - 场景解决方案
      
      Scrum 敏捷开发
      
      Kanban 管理
      
      知识管理
      
      测试管理
      
      产品管理
      
      自动化
      
      行业解决方案
      
      企业服务
      
      汽车电子
      
      先进制造（即将上线）
    - 解决方案1
    - 解决方案2
Jira替代方案

25人以下免费

flume的三大核心组件有哪些

flume的三大核心组件有：1. Source；2. Channel；3. Sink。其中，Source是数据源，通过source组件可以指定让Flume读取哪里的数据，然后将数据传递给后面的 channel。Flume内置支持读取很多种数据源。

一、flume的三大核心组件

1. Source

Source: 数据源:通过source组件可以指定让Flume读取哪里的数据，然后将数据传递给后面的 channel

Flume内置支持读取很多种数据源，基于文件、基于目录、基于TCP\UDP端口、基于HTTP、Kafka的等等。当然了，它也是支持自定义的。

Exec Source:实现文件监控，可以实时监控文件中的新增内容，类似于linux中的tail -f 效果。

NetCat TCP/UDP Source: 采集指定端口(tcp、udp)的数据，可以读取流经端口的每一行数据

Spooling Directory Source:采集文件夹里新增的文件

Kafka Source:从Kafka消息队列中采集数据

2. Channel

Channel: 接受Source发出的数据，可以把channel理解为一个临时存储数据的管道。Channel的类型有很多:内存、文件，内存+文件、JDBC等

Memory Channel:使用内存作为数据的存储

优点是效率高，因为就不涉及磁盘IO

缺点有两个

1:可能会丢数据，如果Flume的agent挂了，那么channel中的数据就丢失了。

2:内存是有限的，会存在内存不够用的情况

File Channel:使用文件来作为数据的存储

优点是数据不会丢失缺点是效率相对内存来说会有点慢，但是这个慢并没有我们想象中的那么慢，所以这个也是比较常用的一种channel。

Spillable Memory Channel:使用内存和文件作为数据存储，即先把数据存到内存中，如果内存中数据达到阈值再flush到文件中

优点:解决了内存不够用的问题。

缺点:还是存在数据丢失的风险

3. Sink

Sink:从Channel中读取数据并存储到指定目的地
Sink的表现形式有很多:打印到控制台、HDFS、Kafka等，

常用的sink组件有:

Logger Sink:将数据作为日志处理，可以选择打印到控制台或者写到文件中，这个主要在测试的时候使用

HDFS Sink:将数据传输到HDFS中，这个是比较常见的，主要针对离线计算的场景

Kafka Sink:将数据发送到kafka消息队列中，这个也是比较常见的，主要针对实时计算场景，数据不落盘，实时传输，最后使用实时计算框架直接处理。

延伸阅读：

二、Flume 基本思想及特点

Flume 采用了插拔式软件架构，所有组件均是可插拔的，用户可以根据自己的需求定制每个组件。Flume 本质上我理解是一个中间件。

Flume 主要具有以下几个特点：

1. 良好的扩展性；Flume 的架构是完全分布式的，没有任何中心化组件，使得其非常容易扩展。

2. 高度定制化；采用插拔式架构，各组件插拔式配置，用户可以很容易的根据需求自由定义。

3. 良好的可靠性；Flume 内置了事务支持，能保证发送的每条数据能够被下一跳收到而不丢失。

4. 可恢复性；依赖于其核心组件channel,选择缓存类型为FileChannel，事件可持久化到本地文件系统中。

以上就是关于Flume的内容希望对大家有帮助。

推荐文章

《2023中国企业敏捷实践白皮书》发布！免费下载

2024-04-18

《2022中国企业敏捷实践白皮书》完整版免费下载

2023-04-10

什么是项目管理，项目经理如何做好项目管理？项目管理入门指南

2023-04-07

如何估算项目成本？方法和依据

2023-11-30

相关阅读

it项目管理要做什么软件

2024-05-23

如何确定YOLO系列算法中的anchor box数量

2024-05-10

如何落实团结协作

2024-07-15

javascript的闭包的概念和ruby的闭包的概念有何异同

2024-05-08

开源鸿蒙硬件开发怎么样

2024-07-29

运维学习docker有没有前途未来如何

2024-05-09

敏捷开发如何进行资本化

2024-07-15

核聚变领域的OA期刊有推荐吗

2024-05-14

为什么协作模式看不到数据

2024-07-15

研发团队中跨功能协作的方法

2024-04-23

标签云

技术文档管理文档结构化 ICT项目管理内网办公文档管理企业文档 PM工程项目旅游项目创业项目可视化管理工业项目管理简易项目管理工具

相关文章

excel怎么设置正值前加

2024-12-20
1

excel横列怎么变成行列

2024-12-20
1

excel串码怎么自动下一行

2024-12-20
2

产品经理如何做好计划

2024-12-20
1

如何和产品经理对话交流

2024-12-20
1

产品经理如何给自己定位

2024-12-20
1

如何启动创新产品经理

2024-12-20
1

产品经理催进度如何应付

2024-12-20
1

外贸经理如何运营产品

2024-12-20
1

10款技术文档管理系统解析：如何选择适合您的系统？

2024-10-03
121