HBase系列常見面試題匯總---怎樣合理設置HBase RowKey 2022-08-12
Rowkey 是一個二進制碼流,建議越短越好,一般不超過 16 個字節,主要是出于以下的考慮:數據的持久化文件 HFile 中是按照 KeyValue 存儲的,...詳情>
HBase系列常見面試題匯總---給一個場景HBase的RowKey設計 2022-08-12
你的題目和描述不一致,你的描述是在說ID-Mapping的問題嗎,這和HBase行鍵設計是兩個領域的問題。先說第一個問題HBase行鍵設計。加鹽(隨機前綴...詳情>
HDFS 機架感知詳解 2022-08-12
互聯網公司的 Hadoop 集群一般都會比較大,幾百臺服務器會分布在不同的機架上,甚至在不同的機房。出于保證數據安全性和數據傳輸的高效性的平...詳情>
Spark repartition和coalesce的區別 2022-08-12
repartition只是coalesce接口中shuffle為true的實現。不經過 shuffle,也就是coaleasce shuffle為false,是無法增加RDD的分區數的,比如你源RD...詳情>
Spark groupByKey 和 reduceBykey 區別 2022-08-12
reduceByKey 可以接收一個 func 函數作為參數,這個函數會作用到每個分區的數據上,即分區內部的數據先進行一輪計算,然后才進行 shuffle 將數...詳情>
Spark Streaming 窗口函數 2022-08-11
理解窗口的兩個關鍵概念,窗口長度(window length)和滑動間隔(slide interval)。 窗口函數會把原始 DStream 的若干批次的數據合并成為一個新的...詳情>
Spark Structured Streaming 優勢 2022-08-11
增量查詢模型(Incremental query model):Structured Streaming 將會在新增的流式數據上不斷執行增量查詢,同時代碼的寫法和批處理 API (基于 ...詳情>
大數據是干什么的?學完大數據有什么用 2022-07-29
大數據是干什么的?大數據是單臺計算機無法處理或在規定時間內無法處理的一組數據。大數據是一種信息資產。接下來給大家分享一些大數據介紹及...詳情>
純小白去學大數據好學嗎?小白如何學習大數據 2022-07-19
純小白去學大數據好學嗎?對于零基礎的學員來說,學習大數據還是有一定難度的。因此在學習前期需要打好基礎,尤其是JAVA語言基礎。如果有條件...詳情>
零基礎應該如何進行大數據的學習?這四個方法不能錯過 2022-07-18
在大數據行業,這個名詞聽上去有點空洞,甚至讓我們很多想入行的小伙伴都有些迷惑,但其實一提到大數據技術,大家的第一印象就“高薪”、“高...詳情>
在線提問
專業導師線上坐鎮,解答個性化學習難題
提交問題