flink - 程序员宅基地

Flink基本原理剖析讲解

Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。Flink最适合的应用场景是低时延的数据处理（Data...

docker 搭建 flink 并上传任务

1.16.0-scala_2.12-java8 镜像版本说明，flink 1.16.0，flink 内置 scala 版本 2.12，Java 版本 8。如下两个容器启动成功，可以看到 web 端口为 18081，taskmanager 启动一个，包含 5 个任务槽。如下：注意运行需要...

[基础架构] [Flink] Flink/Flink-CDC的部署和配置

标签： flink 数据库大数据

Flink 以及 Flink -CDC 部署与配置

Flink第一章实时计算引擎

标签： flink

Flink是一个针对流数据和批数据的分布式处理引擎，代码主要是由java实现，部分代码是scala。它可以处理有界的批量数据集，也可以处理无界的实时数据集。其所要处理的主要场景就是流数据、批数据只是流数据的一个极限...

4.3.2 Flink-流处理框架-Flink CDC数据实时数据同步-何为Flink CDC？

标签： flink 大数据 big data

2.Flink CDC出现的动机 3.基于传统的CDC的ETL分析 4.基于Flink CDC的ETL分析 5.支持的版本和连接器 1.写在前面 CDC是一种可以捕获数据库变更的技术，用于数据同步、数据分发和数据采集等多个现实场景。像我们...

Flink集成Hive 步骤

标签： flink1.12 hive2.3 flinlk集成hive

Flink从1.9开始支持集成Hive，不过1.9版本为beta版，不推荐在生产环境中使用。在Flink1.10版本中，标志着对 Blink的整合宣告完成，对 Hive 的集成也达到了生产级别的要求。值得注意的是，不同版本的Flink对于Hive的...

用4+1架构视图说说Flink架构

标签：架构 flink big data

溯古论今，Flink 起源于德国柏林大学2010年的一个研究项目，2014年到 Apache 舞台露了个脸，2019年被阿里巴巴收购后开始走上人生巅峰，收获一众粉丝，名气越来越大，在实时流计算的地位越来越高，截止本文写作时间，...

Flink总结

标签： flink checkpoint state

Flink总结一、初步了解什么是Flink？ Flink是一个实时的流式计算引擎，与sparkStreaming不同的是底层是流式引擎，并且有用事件窗口和时间窗口两种窗口，可以进行离线和实时计算，有着完美的容错机制，以及数据...

CDH整合Flink（CDH6.3.2+Flink1.12.0）

标签： Flink CDH 大数据

一、准备工作安装jdk1.8及maven，jdk使用CDH安装包中自带的jdk的rpm包即可安装完成后添加环境变量 [root@linux201 ~] vim /etc/profile.d/custom.sh 添加如下内容 # JAVA_HOME JAVA_HOME=/usr/java/jdk1.8.0_181-...

CDH6.2+集成Flink

标签： flink cloudera 大数据

手动编译基于cdh版本的flink

Flink的并行度及Slot

标签： flink

一个Flink程序Application由多个任务组成（source、transformation和sink），一个任务由多个并行实例（线程）来执行，一个任务的并行度实例（线程数）数目被称为该任务的并行度。并行度的设置方式： a、...

在IDEA本地开发时Flink CDC和Flink的guava版本冲突解决办法

标签： IDEA flink CDC Flink

将flink-sql-connector-mysql-cdc/target/flink-sql-connector-mysql-cdc-2.2.0.jar拷贝到本地进行引用，同时将原来pom.xml的flink-connector-mysql-cdc依赖注释掉，最后就可以在本地运行项目了。如果不放心可以在...

大数据——Flink 知识点整理

标签： flink 面试 big data

1. Flink 的特点 Flink 具有高吞吐、低延时、高性能的特点支持基于时间语义、窗口及状态编程同时还具备了 checkpoint 和 savepoint 的功能 2. Flink 和 SparkStreaming 的对比 Flink支持实时流处理，而 Spark...

Flink提交任务

标签： flink 大数据 ui

Flink提交任务的方式有两种，第一种是自带的UI页面，但是这种提交方式很少有团队正式使用，因为这种方式的资源分配是按照task节点为单位运行并度的，一个并行度就要占用一个task节点，国内九成九的都是普通公司，...

Flink基础系列8-Flink on yarn运行wordcount程序

标签： flink flink on yarn flink 程序运行

测试服务器CDH 6.3.1版本安装Flink 1.9版本。 hello.txt文件 hello word hello hdfs hello mapreduce hello yarn hello hive hello spark hello flink 一.Maven配置 Flink依赖的配置 <dependency> <...

flink redis connector（支持flink sql）

标签： flink redis redis connector

flink redis connector（支持flink sql） 1. 背景工作原因，需要基于flink sql做redis sink，但bahir 分支的flink connector支持只是基于datastream，而需要支持flink sql，还需要进一步完善 flink sql及flink ...