寫數據流程 2022-09-02
1. 客戶端發出請求hdfs dfs -put /etc/profile /qf/data。2. namenode查看維護的目錄結構,檢查/qf/data是否存在,如不存在直接報錯”no such ...詳情>
Spark Streaming的窗口大小,每個窗口處理的數據量大小。 2022-09-02
該問題一定要根據業務需求來確定,比如要實現的需求為:統計每分鐘的前一個小時的在線人數。上面需求的窗口大?。ù翱陂L度)為1小時,然后再統...詳情>
SparkStreaming的批次間隔,處理完的的數據存在哪里 2022-09-02
批次間隔為SparkStreaming處理實時需求的時間間隔,需要根據業務需求來確定批次間隔。實時需求的處理結果一般是保存在能快速讀取的數據庫中來...詳情>
MapReduce的原理(重點) 2022-09-02
MapperTask 使用邏輯切片的方式劃分block,調用InputFormat中的算法進行劃分,TextInputFormat默認按照128M進行劃分(默認一個block至少有一片...詳情>
多線程的用處 2022-09-01
這樣可以為不同的任務步驟建立線程。網絡程序設計為提高網絡的利用效率,我們可能使用多線程,對每個連接用一個線程去處理。數據共享 同一個進...詳情>
什么是線程 2022-09-01
為了減少系統開銷,從進程中演化出了線程。線程存在于進程中,共享進程的資源。線程是進程中的獨立控制流,由環境(包括寄存器組和程序計數器)...詳情>
線程和進程區別 2022-09-01
在進程切換時候,涉及到整個當前進程 CPU 環境的保存以及新被調度運行的進程的 CPU 環境的設置;并發性: 不僅進程間可以并發執行,而且在一個...詳情>
大數據面試題:ClickHouse為什么快?Git是什么? 2022-09-01
Git是什么,介紹一下。Git是一個分布式版本控制器,相比較SVN來說,每個人都是一個版本的控制者,而且代表管理方便,使用簡單,現在git已經整...詳情>
共享內存特點 2022-09-01
1、 共享內存是進程間共享數據的一種最快的方法。一個進程向共享的內存區域寫入了數據,共享這個內存區域的所有進程就可以立刻看到其中的內容...詳情>
物聯網面試題之共享內存篇 2022-09-01
什么是共享內存?共享內存是允許兩個或者多個進程共享給定的存儲區域。進程間通信為什么要使用共享內存?在linux進程間通信的方式中,共享內存...詳情>
在線提問
專業導師線上坐鎮,解答個性化學習難題
提交問題