科技排头@高级应用模式第二辑：应用模式的动态更新，Flink( 二 ) 在本系列的第一篇文章中

DynamicKeyFunction和DynamicAlertFunction之间的HASH连接意味着，对于每个消息都将计算一个哈希码，并且消息将在下一个运算符的可用并行实例之间平均分配。需要使用keyBy从Flink显式“请求”这样的连接。

文章图片
图4：在运算符实例之间传递的哈希消息（通过keyBy）
REBALANCE分布是由对rebalance()的显式调用或并行度的更改（对于图2中的作业图而言，为12->1）引起的。调用rebalance()会使数据以循环方式重新分区，并且在某些情况下可以帮助减轻数据偏斜。

文章图片
图5：跨运算符实例传递的REBALANCE消息
图2中的欺诈检测作业图包含一个附加数据源：规则源（RulesSource）。它还从Kafka消费。规则通过BROADCAST通道“混合”到主处理数据流中。在运算符之间传输数据的其他方法（例如forward、hash或rebalance），会让每个消息只可在接收的运算符的并行实例之一中处理；相比之下， broadcast会让每个消息在broadcaststream连接的运算符的所有并行实例的输入上可用。这使得broadcast方法适用于多种需要影响所有消息处理的任务，而无需考虑它们的键或源分区。

文章图片
图6：跨运算符实例传递的BROADCAST消息
注意：实际上Flink中有一些更特殊的数据分区方案，我们在这里没有提到。如果你想了解更多信息，请参阅Flink有关流分区的文档。
广播状态模式
为了使用规则源，我们需要将其“连接”到主数据流：
//StreamssetupDataStream<Transaction>transactions=[...]DataStream<Rule>rulesUpdateStream=[...]{1}BroadcastStream<Rule>rulesStream=rulesUpdateStream.broadcast(RULES_STATE_DESCRIPTOR);{1}//ProcessingpipelinesetupDataStream<Alert>alerts=transactions.connect(rulesStream).process(newDynamicKeyFunction()).keyBy((keyed)->keyed.getKey()).connect(rulesStream).process(newDynamicAlertFunction())如你所见，可以调用broadcast方法并指定状态描述符，从任何常规流中创建广播流。 Flink假定在处理主数据流的事件时需要存储和检索广播的数据，因此总是从该状态描述符自动创建相应的广播状态（broadcaststate）。这与其他的ApacheFlink状态类型是不一样的，其他类型中你需要在处理函数的open()方法中对其进行初始化。另请注意，广播状态始终具有键值格式（MapState）。
publicstaticfinalMapStateDescriptor<Integer,Rule>RULES_STATE_DESCRIPTOR=newMapStateDescriptor<>(''rules'',Integer.class,Rule.class);连接到rulesStream会导致处理函数的签名发生某些变化。上一篇文章在这里做了一点简化，用的是ProcessFunction 。但是， DynamicKeyFunction实际上是一个BroadcastProcessFunction 。
?复制代码
publicabstractclassBroadcastProcessFunction<IN1,IN2,OUT>{publicabstractvoidprocessElement(IN1value,ReadOnlyContextctx,Collector<OUT>out)throwsException;publicabstractvoidprocessBroadcastElement(IN2value,Contextctx,Collector<OUT>out)throwsException;}这里的区别在于增加了processBroadcastElement方法，规则流的消息将通过该方法到达。下面新版本的DynamicKeyFunction允许在运行时通过这个流，修改数据分配键的列表：
publicclassDynamicKeyFunctionextendsBroadcastProcessFunction<Transaction,Rule,Keyed<Transaction,String,Integer>>{@OverridepublicvoidprocessBroadcastElement(Rulerule,Contextctx,Collector<Keyed<Transaction,String,Integer>>out){BroadcastState<Integer,Rule>broadcastState=ctx.getBroadcastState(RULES_STATE_DESCRIPTOR);broadcastState.put(rule.getRuleId(),rule);}@OverridepublicvoidprocessElement(Transactionevent,ReadOnlyContextctx,Collector<Keyed<Transaction,String,Integer>>out){ReadOnlyBroadcastState<Integer,Rule>rulesState=ctx.getBroadcastState(RULES_STATE_DESCRIPTOR);for(Map.Entry<Integer,Rule>entry:rulesState.immutableEntries()){finalRulerule=entry.getValue();out.collect(newKeyed<>(event,KeysExtractor.getKey(rule.getGroupingKeyNames(),event),rule.getRuleId()));}}}在上面的代码中， processElement()接收事务，而processBroadcastElement()接收规则更新。创建新规则后将按图6所示分配，并使用processBroadcastState将其保存在运算符的所有并行实例中。我们使用规则的ID作为存储和引用各个规则的键。我们不再迭代硬编码的List ，而是迭代动态更新的广播状态的条目。

科技排头@高级应用模式第二辑：应用模式的动态更新，Flink( 二 )

推荐阅读

央视新闻客户端|服务贸易到底是啥？它和日常生活有啥联系？一文看懂：服贸就在我们身边

茭白需要炒几分钟

阿里巴巴从蒋凡事件谈阿里巴巴合伙人制度设计：股权激励费用数目惊人

央视新闻|49岁眼科女医生去世，将眼角膜和遗体分别捐献给医院和大学

[生肖]家有此3大生肖，贵人助力，富足旺财，6月下旬，职场风生水起

南充新闻网|白俄罗斯代表46国在联合国人权理事会作共同发言支持中国在涉疆问题上的立场

美国今年近2.7万人因枪死亡|美国今年近2.7万人因枪死亡具体是什么情况？

猛龙|30＋11＋8三分！范弗里特打疯了，真对不起，小卡真不是单核夺冠

鼎盛军事|配备中国造14.5重机枪，威力十分强悍，伊朗自产防雷车已大量服役

经济|新闻观察 | 各地项目集中开工支撑基建投资保持高位投资需求加速释放

大众报业·海报新闻|富力主帅：战鲁能上年轻人

29年前，那位大喊“我要读书”的大眼睛女孩苏明娟，如今成了这样

土耳其安哥拉猫生活习性介绍

周迅|48岁周迅怎么还那么嫩！庆生照穿衬衫古灵精怪美成少女，状态超好

许7秒记忆■文玩沉香手串应该如何保养？

德国党卫军跟国防军区别,二战时期德国国防军跟党卫军有什么区别-

安东尼|美国女子陈尸家中两年死因成谜，四子女同屋照常生活

小丑的娱乐|萧亚轩男友累到吐血就医：天后表示非常的自责，富婆真是不好伺候

乘坐动车时大行李箱放在哪里比较好？

zol中关村在线首款支持5G+Wi-Fi 6平板官宣四等边框设计爱了