麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > Spark Streaming 反壓機制(Back Pressure)

Spark Streaming 反壓機制(Back Pressure)

來源:千鋒教育
發布人:syq
時間: 2022-08-11 17:05:31 1660208731

  Spark Streaming 反壓機制是1.5版本推出的特性,用來解決處理速度比攝入速度慢的情況,簡單來講就是做流量控制。當批處理時間(Batch Processing Time)大于批次間隔(Batch Interval,即 BatchDuration)時,說明處理數據的速度小于數據攝入的速度,持續時間過長或源頭數據暴增,容易造成數據在內存中堆積,最終導致Executor OOM。反壓就是來解決這個問題的。

Spark Streaming 反壓機制

  spark streaming的消費數據源方式有兩種:

  若是基于Receiver的數據源,可以通過設置spark.streaming.receiver.maxRate來控制最大輸入速率;

  若是基于Direct的數據源(如Kafka Direct Stream),則可以通過設置spark.streaming.kafka.maxRatePerPartition來控制最大輸入速率。

  當然,在事先經過壓測,且流量高峰不會超過預期的情況下,設置這些參數一般沒什么問題。但最大值,不代表是最優值,最好還能根據每個批次處理情況來動態預估下個批次最優速率。

  在Spark 1.5.0以上,就可通過背壓機制來實現。開啟反壓機制,即設置spark.streaming.backpressure.enabled為true,Spark Streaming會自動根據處理能力來調整輸入速率,從而在流量高峰時仍能保證最大的吞吐和性能

  Spark Streaming的反壓機制中,有以下幾個重要的組件:

  RateController

  RateController 組件是 JobScheduler 的監聽器,主要監聽集群所有作業的提交、運行、完成情況,并從 BatchInfo 實例中獲取以下信息,交給速率估算器(RateEstimator)做速率的估算。

  當前批次任務處理完成的時間戳 (processingEndTime)

  該批次從第一個 job 到最后一個 job 的實際處理時長 (processingDelay)

  該批次的調度時延,即從被提交到 JobScheduler 到第一個 job 開始處理的時長(schedulingDelay)

  該批次輸入數據的總條數(numRecords)

  RateEstimator

  Spark 2.x 只支持基于 PID 的速率估算器,這里只討論這種實現。基于 PID 的速率估算器簡單地說就是它把收集到的數據(當前批次速率)和一個設定值(上一批次速率)進行比較,然后用它們之間的差計算新的輸入值,估算出一個合適的用于下一批次的流量閾值。這里估算出來的值就是流量的閾值,用于更新每秒能夠處理的最大記錄數

  RateLimiter

  以上這兩個組件都是在Driver端用于更新最大速度的,而RateLimiter是用于接收到Driver的更新通知之后更新Executor的最大處理速率的組件。RateLimiter是一個抽象類,它并不是Spark本身實現的,而是借助了第三方Google的GuavaRateLimiter來產生的。它實質上是一個限流器,也可以叫做令牌,如果Executor中task每秒計算的速度大于該值則阻塞,如果小于該值則通過,將流數據加入緩存中進行計算。

  * 反壓機制真正起作用時需要至少處理一個批:由于反壓機制需要根據當前批的速率,預估新批的速率,所以反壓機制真正起作用前,應至少保證處理一個批。

  * 如何保證反壓機制真正起作用前應用不會崩潰:要保證反壓機制真正起作用前應用不會崩潰,需要控制每個批次最大攝入速率。若為Direct Stream,如Kafka Direct Stream,則可以通過spark.streaming.kafka.maxRatePerPartition參數來控制。此參數代表了 每秒每個分區最大攝入的數據條數。假設BatchDuration為10秒,spark.streaming.kafka.maxRatePerPartition為12條,kafka topic 分區數為3個,則一個批(Batch)最大讀取的數據條數為360條(3*12*10=360)。同時,需要注意,該參數也代表了整個應用生命周期中的最大速率,即使是背壓調整的最大值也不會超過該參數。

  反壓相關的參數

1

  更多關于大數據培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。

  注:本文部分文字和圖片來源于網絡,如有侵權,請聯系刪除。版權歸原作者所有!

 

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
主站蜘蛛池模板: 小蝌蚪视频在线观看www| 黄色三级三级免费看| 夜夜躁狠狠躁日日躁视频| 本子库里番acg全彩无遮挡| 一道本在线观看| 国产一区二区三区久久精品| 交换交换乱杂烩系列yy| 国产三级精品三级| 免费人成在线观看视频播放| 特大巨黑吊aw在线播放| 夜夜爱爱| 公交车上性配合享受视频| 亚洲成人福利在线观看| 国产一区二区精品久久| 久久精品无码一区二区日韩av| 3d动漫精品啪啪一区二区免费| 久久国产精品99精品国产| 久久精品国产精品亚洲毛片| 中文字幕在线观看国产| 男插女下体视频| 厨房切底征服岳| 美女不遮不挡的免费视频裸体| 好男人影视官网在线www| 好男人什么影院| 国产剧情乱偷| 在车子颠簸中进了老师的身体| 女人是男人的未来1分29分| 又大又爽又湿又紧a视频| 夫妇交换性三中文字幕| 蜜桃成熟之蜜桃仙子| 色综合久久一本首久久| 最近中文字幕高清免费大全8| 一个妈妈的女儿在线观看5| 中文字幕在线观看第二页| 亚洲综合久久综合激情久久| 男女性潮高清免费网站| 波多野结衣在线看片| 色老太bbw| 黄色一级片日本| 最近中文字幕免费mv视频7| 好男人社区神马www|