300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 阿里云Blink介绍

阿里云Blink介绍

时间:2018-08-01 09:31:53

相关推荐

阿里云Blink介绍

阿里云Blink产品介绍

产品公告

4月28日-独享模式暂停新购

实时计算Flink版独享模式已于4月28日暂停新购,目前仅支持原有项目的扩缩容和续费操作。如果您有新购需求,推荐使用实时计算Flink全托管

产品概述

阿里云实时计算Flink版独享/共享集群(原产品线)支持共享模式和独享模式两种产品模式。独享模式是基于共享模式的补充,具备更加丰富的功能。

共享模式(已停购)

不同用户共享计算集群的物理资源(网络、磁盘、CPU或内存等),通过账号管理、CGroup(Control Groups)等方式进行资源隔离和安全管理。基于账号安全、业务安全和数据安全方面的考虑,共享模式不提供自定义函数功能。

说明实时计算共享模式已于12月24日正式下线,不再支持共享模式新项目的购买,仅支持原有项目的扩缩容、续费操作。如果您有新购需求,推荐使用实时计算独享模式或Flink半托管模式。

独享模式

独享模式是指在阿里云云服务器ECS(Elastic Compute Service)上单独为用户创建的独立计算集群。单个用户独享计算集群的物理资源(网络、磁盘、CPU或内存等),与其它用户的资源完全独立。与共享模式相比,独享模式具有以下优点:

多种硬件均可适配用户间的隔离支持自定义函数丰富的功能

独享模式系统网络架构

实时计算独享模式为全托管模式。

发展历程

阿里云实时计算在原有Flink系统基础上,提供一整套的开发平台和完整的流式数据处理业务流程。

起源:脱胎于双十一实时大屏业务萌芽:以开源Flink作为基础发展:基于Flink的API开发成熟:Flink SQL开发完成

业务流程

业务流程简介

实时计算业务流程系统架构图如下。

数据采集

广义的实时数据采集,是指使用流式数据采集工具,将数据实时地采集并传输到大数据Pub/Sub(发布订阅)系统。Pub/Sub系统将为下游实时计算提供源源不断的事件源,触发流式计算作业的运行。阿里云大数据生态提供了针对不同场景领域的流式数据Pub/Sub系统。阿里云实时计算天然集成上图中诸多的Pub/Sub系统,能够集成各类流式数据。

说明例如,您可以直接使用实时计算对接日志服务(LogService)的LogHub系统,快速的集成并使用ECS日志。

流式计算

流数据作为实时计算的触发源,驱动实时计算运行。一个实时计算作业至少使用一个流数据作为数据源。对于复杂的业务场景,实时计算支持和静态数据存储进行关联查询。

说明例如,针对DataHub流式数据,实时计算可以根据流式数据的主键,和RDS中数据进行关联查询(即JOIN查询)。

实时集成

阿里云实时计算可以将计算的结果数据直接写入目的数据存储。阿里云实时计算天然集成了OLTP(例如RDS)、NoSQL(例如OTS)、OLAP(例如ADB)、MessageQueue(例如DataHub、ONS)、MassiveStorage(例如OSS、MaxCompute)等阿里云生态系统,最大程度地降低全链路数据的时延和数据链路的复杂度,保证数据加工的实时性。

数据消费

流式计算的结果数据进入各类数据存储后,您可以运用个性化的应用,操控结果数据。例如使用数据存储系统访问数据,使用消息投递系统接受信息,或使用告警系统生成异常结果数据警报。

数据链路

部分阿里云生态外部数据存储不能和实时计算系统完全匹配,需要使用其它类型流数据进行转换。

DataHub

DataHub提供了多类数据(如日志、数据库BinLog、IoT数据流等)上传到DataHub的工具、界面,以及开源、商业软件的集成。

LogService

日志服务(LogService)是针对日志类数据的一站式服务。LogService提供了诸多针对日志的采集、消费、投递、查询分析等功能。

IoTHub

阿里云物联网平台(IoTHub)是能够帮助开发者搭建安全的数据通道,方便终端(如传感器、执行器、嵌入式设备或智能家电等等)和云端的双向通信。使用IoTHub规则引擎,可以将IoT数据方便投递到DataHub,并利用实时计算和MaxCompute进行数据加工计算。

DTS

数据传输(DTS)支持以数据库为核心的结构化存储产品之间的数据传输。DTS是一种集数据迁移、数据订阅及数据实时同步于一体的数据传输服务。使用DTS的数据传输功能,可以方便您将RDS等BinLog解析并投递到DataHub,并利用实时计算和MaxCompute进行数据加工计算。

MQ

阿里云MQ服务是一套完整的消息云服务。阿里云MQ服务基于高可用分布式集群技术,搭建了包括发布订阅、消息轨迹、资源统计、定时(延时)、监控报警等功能。

支持的上下游存储

实时计算支持丰富的上下游生态。

数据源表 创建Oracle数据库源表创建数据总线DataHub源表创建日志服务SLS源表创建交互式分析Hologres源表创建消息队列MQ源表创建消息队列Kafka源表创建表格存储Tablestore源表创建全量MaxCompute源表创建增量MaxCompute源表 数据结果表 创建云原生数据仓库AnalyticDB MySQL版2.0结果表创建交互式分析Hologres结果表创建Oracle数据库结果表创建数据总线DataHub结果表创建日志服务SLS结果表创建消息队列MQ结果表创建表格存储Tablestore结果表创建云数据库RDS版结果表创建MaxCompute结果表创建云数据库HBase版结果表创建Elasticsearch结果表创建时序数据库结果表创建消息队列Kafka结果表创建云数据库HybridDB for MySQL结果表创建云数据库RDS SQL Server版结果表创建云数据库Redis版结果表创建云数据库MongoDB版结果表创建云原生数据仓库AnalyticDB MySQL版3.0结果表创建分析型数据库PostgreSQL版结果表创建自定义结果表创建InfluxDB结果表创建Phoenix5结果表 数据维表 创建交互式分析Hologres维表创建表格存储Tablestore维表创建云数据库RDS版维表创建云数据库HBase版维表创建MaxCompute维表创建云数据库Redis维表创建Phoenix5维表创建分析型数据库MySQL版3.0维表创建Elasticsearch维表

使用限制

CU处理能力

实时计算当前在内部压测场景下,一个CU的处理能力估算如下:

简单业务:例如单流过滤、字符串变换等操作,1CU每秒可以处理10000条数据。复杂业务:例如JOIN、窗口、GROUP BY等操作,1CU每秒可以处理1000到5000条数据。

作业、任务数量限制

实时计算对整个项目(Project)下属的作业、Task版本、IDE打开Task页面数量均有不同限制。包括:

单个项目下允许最多创建作业的个数为100。单个项目下允许最多的文件夹的个数为50,层级最大不超过5层。单个项目下允许最多的UDX或JAR个数为50。单个项目下允许最多注册数据存储的个数为50。单个作业允许最多的历史保存版本数为20。

产品定价

计量项

实时计算的基本计量单位为Compute Unit(CU),即计算资源,1CU=1核CPU+4 GB内存。CU对应实时计算底层系统的CPU计算能力。

1个实时计算作业(Job)的CU使用量取决于此Job输入数据流的QPS、计算复杂程度,以及具体的输入数据分布情况。实时计算1CU的处理能力可以通过以下方式估算:

简单业务:1CU每秒可以处理10000条数据。例如,单流过滤、字符串变换等操作。复杂业务:1CU每秒可以处理1000至5000条数据。例如,JOIN、GROUP BY或窗口函数等操作。

说明

上述计算能力估值仅限于实时计算内部处理能力,不包括对外数据读取和写入部分。外部数据的读写效率会影响您对实时计算能力的评估,示例如下: 如果实时计算需要从日志服务(Log Service)读取数据,但LogService对于请求调用配额(Quota)存在一定限制,则实时计算整体的计算能力将被限制在LogService允许的范围内。如果实时计算引用的RDS数据存储存在连接数或者TPS限制,则实时计算吞吐能力将受限于RDS本身的流控限制。 如果作业中使用窗口函数,CU的使用量会比简单作业高,建议至少购买4CU。

计费方式

注意

包年包月到期后请及时续费,如果未及时续费,到期7天后您的实例会被释放。

共享模式(已停购)

说明实时计算共享模式已于12月24日正式下线。

根据CU数进行计费,每个CU每天的价格是6元人民币。例如,您购买10CU,使用1个月(假设当月天数为30天)的费用为1800元人民币。实时计算共享模式的最小起售单位为2CU每天。

独享模式包年包月(已停购)

说明独享模式包年包月已于4月28日暂停新购。

独享模式包年包月根据购买的机型及数量进行计费,各机型单价如下。

规格选择

背景介绍

独享模式集群相当于一个主从分布式集群。整个集群由Master和Slave两部分构成:

Master:管理整个集群的资源和Slave之间的交互,但不能用于计算。Slave:计算节点。

说明设备间通信以及操作系统需要消耗资源,所以一台Slave的资源并不能全部用于计算。

注意事项

Slave机型配置决定了您以后的扩容或者缩容的步骤。例如,您的Slave机型是8核32GB,则每次扩容或缩容即增加或减少n台8核32GB的机器,您的可用资源即增加或者减少n个6CU。购买时Master选择三台是为了集群的稳定性,可以做到Master故障时完成主备切换。如果您选择三台Master的配置,阿里云会为您提供服务可用性(SLA)保障。Master机型的台数不能进行变更。

规格选择

与共享模式的CU概念(1CU=1核4GB)一样,独享模式配置也可以按照CU的方式进行换算。您可以按照以下计算逻辑,选择出各种机型搭配,实时计算Flink版价格计算器能够为您计算出价格较低的机型配比。

Slave型号以及Master型号和实际可用CU的换算关系经验值如下表:

购买Slave机型的最小台数为2,即独享模式最小的实际计算能力为6CU(3CU*2)。Master型号受整体集群CU大小的限制,对应集群最大CU规格经验值如下表。

说明经验值仅供参考。

变配指导

集群变配

您可以调整master型号slave数量,实现独享集群配置的变更。

登录项目管理页面。 鼠标悬停至页面右上角账号位置。单击项目管理。 在左侧导航栏,单击集群管理 > 集群列表。在集群列表中,单击目标集群操作列下的更多,选择扩容缩容

项目变配

登录项目管理页面。 鼠标悬停至页面右上角账号位置。单击项目管理。 在左侧导航栏,单击集群管理 > 项目列表。变更资源配置: 在项目列表中,单击目标项目操作列下的扩/缩容。在项目扩容/缩容窗口,设置CU数。单击确定

释放集群

完成集群使用后,您可以通过释放独享模式(按量付费)集群的方式,停止计费。本文为您介绍如何释放实时计算集群。

注意

集群释放完成后,项目会被删除。如果您再次购买实时计算服务后新建项目,可以导入原有项目的作业。

实时计算控制台。鼠标悬停至页面右上角账号位置,单击项目管理。在左导航栏中,单击集群列表。在集群列表页面中,单击目标集群操作列中的释放。单击确认

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。