Flink基础
目录
- Flink的特点
- Flink流处理简介
- Flink是什么
- Flink的应用场景
- 为什么选择Flink
- 分层API
Flink的特点
结果正确
高吞吐
高容错
易用的API
低延迟
语义化窗口
Flink流处理简介
Flink跟Spark的主要区别:
Flink做的是流处理,而Spark主要做的是批处理
Flink是什么
Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算
Flink的应用场景
物联网:
实时数据采集
实时报警
银行和金融业:
实时结算
风险检测
电商和市场营销:
实时报表
广告投放
实时推荐
物流配送及服务
订单状态跟踪
信息推送
为什么选择Flink
批处理和流处理
流处理更真实反映了我们的生活方式
我们的目标:
低延迟、高吞吐、结果的准确性和良好的容错性
lambda架构:
用两套系统,同时保证低延迟和结果准确
分层API
越顶层越抽象,表达含义越简明,使用越方便
越底层越具体,表达能力越丰富,使用越灵活