大數(shù)據(jù)面試題:用戶畫像、推薦系統(tǒng)、Flink實時數(shù)倉、準(zhǔn)實時數(shù)倉中常見問題都有什么? 2022-06-29
我們在選擇如何存儲用戶標(biāo)簽時,遇到了問題(標(biāo)簽查詢速度慢,并且構(gòu)建不夠靈活,標(biāo)簽更新和刪除比較麻煩),比如之前用HDFS或者ES存儲,后來切...詳情>
大數(shù)據(jù)面試題:kafka詳解 2022-06-21
1.延遲隊列,重試隊列,死信隊列,延遲隊列:用戶登錄過時,訂單30分鐘自動取消;重試隊列:可以利用延遲隊列實現(xiàn),即該消息處理失敗后,多久...詳情>
大數(shù)據(jù)面試題:kafka 2022-06-21
在正常情況下,AR應(yīng)該是和ISR一樣的,但是當(dāng)某個Follower副本落后太多或者某個Follower副本節(jié)點(diǎn)掛掉了,那么它會被移出ISR放入OSR中,kafka的...詳情>
大數(shù)據(jù)面試題:hbase布隆過濾器 2022-06-21
對于hbase而言,當(dāng)我們選擇采用布隆過濾器之后,HBase會在生成StoreFile(HFile)時包含一份布隆過濾器結(jié)構(gòu)的數(shù)據(jù),稱其為MetaBlock;MetaBlock與...詳情>
大數(shù)據(jù)面試題:hbase基礎(chǔ) 2022-06-21
列簇 :HBASE表中的每個列,都?xì)w屬于某個列族。列族是表的schema的一部分(而列不是),必須在使用表之前定義。列名都以列族作為前綴。例如 cour...詳情>
大數(shù)據(jù)面試題:SQL 2022-06-21
數(shù)據(jù)傾斜怎么解決?1)key 盡量打亂;提高reduce任務(wù)數(shù);2)關(guān)聯(lián)查詢時,利用分桶和map-side提高查詢效率詳情>
大數(shù)據(jù)面試題:hive數(shù)據(jù)導(dǎo)入 2022-06-21
load data inpath '/hadoop/guozy/data/user.txt' into table external_table;此處是移動(非復(fù)制),移動數(shù)據(jù)非常快,不會對數(shù)據(jù)是否符合定義的...詳情>
大數(shù)據(jù)面試題:分區(qū)和分桶 2022-06-21
分區(qū)指的就是將數(shù)據(jù)按照表中的某一個字段進(jìn)行統(tǒng)一歸類,并存儲在表中的不同的位置,也就是說,一個分區(qū)就是一類,這一類的數(shù)據(jù)對應(yīng)到hdfs存儲...詳情>
熱問標(biāo)簽 更多>>
在線提問
專業(yè)導(dǎo)師線上坐鎮(zhèn),解答個性化學(xué)習(xí)難題
提交問題