麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > 大數(shù)據(jù)面試題:經(jīng)典面試題答疑(四)

大數(shù)據(jù)面試題:經(jīng)典面試題答疑(四)

來(lái)源:千鋒教育
發(fā)布人:syq
時(shí)間: 2022-06-08 16:47:00 1654678020

  大數(shù)據(jù)經(jīng)典面試題答疑---經(jīng)常問(wèn)的原理問(wèn)題總結(jié)(系列文章,持續(xù)更新),幫你解決大數(shù)據(jù)開(kāi)發(fā)中的困擾。

  1. hive+MapReduce

  答案區(qū):

  1.hbase

  1.1. hbase基礎(chǔ)

  1.1.1. hbase數(shù)據(jù)模型

wpsAWvrBL

  1.1.2. Row Key

  概括:最大64KB;在hbase中以字節(jié)數(shù)組保存;不同rowkey按字典順序排序

  1.1.3. Columns Family

  列簇 :HBASE表中的每個(gè)列,都?xì)w屬于某個(gè)列族。列族是表的schema的一部分(而列不是),必須在使用表之前定義。列名都以列族作為前綴。例如 courses:history,courses:math都屬于courses 這個(gè)列族。

  1.1.4. Cell

  由{row key, columnFamily, version} 唯一確定的單元。cell中 的數(shù)據(jù)是沒(méi)有類型的,全部是字節(jié)碼形式存貯。

  關(guān)鍵字:無(wú)類型、字節(jié)碼

  1.1.5. Time Stamp

  HBASE 中通過(guò)rowkey和columns確定的為一個(gè)存貯單元稱為cell。每個(gè) cell都保存 著同一份數(shù)據(jù)的多個(gè)版本。版本通過(guò)時(shí)間戳來(lái)索引。時(shí)間戳的類型是 64位整型。時(shí)間戳可以由HBASE(在數(shù)據(jù)寫(xiě)入時(shí)自動(dòng) )賦值,此時(shí)時(shí)間戳是精確到毫秒的當(dāng)前系統(tǒng)時(shí)間。時(shí)間戳也可以由客戶顯式賦值。如果應(yīng)用程序要避免數(shù)據(jù)版 本沖突,就必須自己生成具有唯一性的時(shí)間戳。每個(gè) cell中,不同版本的數(shù)據(jù)按照時(shí)間倒序排序,即最新的數(shù)據(jù)排在最前面。

  為了避免數(shù)據(jù)存在過(guò)多版本造成的的管理 (包括存貯和索引)負(fù)擔(dān),HBASE提供 了兩種數(shù)據(jù)版本回收方式。

  一是保存數(shù)據(jù)的最后n個(gè)版本;

  二是保存最近一段 時(shí)間內(nèi)的版本(比如最近七天)。用戶可以針對(duì)每個(gè)列族進(jìn)行設(shè)置。

  1.2. 原理

wps16F6FI

  Region是Hbase中分布式存儲(chǔ)和負(fù)載均衡的最小單元,不同Region分布到不同RegionServer上。

04

  Region雖然是分布式存儲(chǔ)的最小單元,但并不是存儲(chǔ)的最小單元。Region由一個(gè)或者多個(gè)Store組成,每個(gè)store保存一個(gè)columns family;每個(gè)Strore又由一個(gè)memStore和0至多個(gè)StoreFile組成,StoreFile包含HFile;memStore存儲(chǔ)在內(nèi)存中,StoreFile存儲(chǔ)在HDFS上。

05

  1.2.1. 寫(xiě)流程:

  1、client向hregionserver發(fā)送寫(xiě)請(qǐng)求。

  2、hregionserver將數(shù)據(jù)寫(xiě)到hlog(write ahead log)。為了數(shù)據(jù)的持久化和恢復(fù)。

  3、hregionserver將數(shù)據(jù)寫(xiě)到內(nèi)存(memstore)

  4、反饋client寫(xiě)成功。

  1.2.2. 數(shù)據(jù)flush:

  1、當(dāng)memstore數(shù)據(jù)達(dá)到閾值(默認(rèn)是128M)或region中所有Memstore的大小總和達(dá)到了上限(默認(rèn) 2*128 = 256MB)會(huì)觸發(fā)將將數(shù)據(jù)刷到硬盤,將內(nèi)存中的數(shù)據(jù)刪除,同時(shí)刪除Hlog中的歷史數(shù)據(jù)。

  2、并將數(shù)據(jù)存儲(chǔ)到hdfs中。

  3、在hlog中做標(biāo)記點(diǎn)。

  1.2.3. 數(shù)據(jù)compact(合并):

  將storefile 中的hfile 合并成大的hfile;

  在hbase中主要存在兩種類型的compaction合并

  minor compaction 小合并

  在將Store中多個(gè)HFile合并為一個(gè)HFile,對(duì)于超過(guò)了TTL的數(shù)據(jù)、刪除的數(shù)據(jù)僅僅只是做了標(biāo)記。

  major compaction 大合并

  合并Store中所有的HFile為一個(gè)HFile,清理三類無(wú)意義數(shù)據(jù):被刪除的數(shù)據(jù)、TTL過(guò)期數(shù)據(jù)、版本號(hào)超過(guò)設(shè)定版本號(hào)的數(shù)據(jù)。默認(rèn)7天執(zhí)行一次,并且性能消耗非常大。手動(dòng)觸發(fā):major_compact tableName

  1.2.4. 讀流程

  1、通過(guò)zookeeper和-ROOT- .META.表定位region

  2、hbase會(huì)首先在布隆過(guò)濾器中查詢(如果設(shè)置的話),然后MemStore,BlockCache(LRUCache存放最近讀取數(shù)據(jù)),磁盤的HFile,找到并存儲(chǔ)到BlockCache

  3、數(shù)據(jù)塊會(huì)緩存

  1.2.5. hregionserver的職責(zé)

  HRegion Server主要負(fù)責(zé)響應(yīng)用戶I/O請(qǐng)求,向HDFS文件系統(tǒng)中讀寫(xiě)數(shù)據(jù),是HBASE中最核心的模塊。

  HRegion Server管理region。

  1.3. hbase 布隆過(guò)濾器

  不存在的一定不存在,存在的不一定存在;

  1.3.1. 布隆過(guò)濾器的存儲(chǔ)在哪?

  對(duì)于hbase而言,當(dāng)我們選擇采用布隆過(guò)濾器之后,HBase會(huì)在生成StoreFile(HFile)時(shí)包含一份布隆過(guò)濾器結(jié)構(gòu)的數(shù)據(jù),稱其為MetaBlock;MetaBlock與DataBlock(真實(shí)的KeyValue數(shù)據(jù))一起由LRUBlockCache維護(hù)。

  cell較小的不適用布隆過(guò)濾器;

  按行讀,更新數(shù)據(jù)量大,范圍廣(多列),用row;

  1.3.2. 協(xié)處理器

  observe:通過(guò)鉤子函數(shù),做一些預(yù)處理和后處理;類似于 RDBMS 中的觸發(fā)器,主要在服務(wù)端工作,主要有三種

  regionObserve:處理數(shù)據(jù)修改數(shù)據(jù);如:創(chuàng)建二級(jí)索引

  maserObserve:管理DDL類型操作

  WALObserve:提供針對(duì)WAL的鉤子函數(shù)

  endpoint:類似于 RDBMS 中的存儲(chǔ)過(guò)程,主要在服務(wù)端工作,可以實(shí)現(xiàn) min、max、avg、sum、distinct、group by 等功能。

  更多關(guān)于大數(shù)據(jù)培訓(xùn)的問(wèn)題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項(xiàng)目實(shí)操的話可以點(diǎn)擊咨詢課程顧問(wèn),獲取試聽(tīng)資格來(lái)試聽(tīng)我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
藍(lán)v抖音小店怎么開(kāi)通店鋪

藍(lán)v抖音小店是一個(gè)非常熱門的電商平臺(tái),它可以讓賣家在抖音上開(kāi)設(shè)自己的店鋪,從而出售自己的商品。隨著抖音的不斷發(fā)展壯大,越來(lái)越多的賣家希...詳情>>

2023-10-08 14:51:53
抖音小店怎么更改類目名稱

抖音小店是現(xiàn)在非?;馃岬囊环N網(wǎng)店形態(tài),許多小生意也從中獲得了收益。但是隨著經(jīng)營(yíng)時(shí)間的增長(zhǎng),小店也需要對(duì)自己的類目名稱進(jìn)行更改,因?yàn)檫@可...詳情>>

2023-10-08 14:46:50
抖音小店怎么合作賣貨

抖音小店作為一種新型的電商形式,近年來(lái)在國(guó)內(nèi)市場(chǎng)上逐漸火熱起來(lái),成為了許多年輕人賺取收入的途徑之一。因?yàn)槎兑糇鳛楫?dāng)前最流行的短視頻平臺(tái)...詳情>>

2023-10-08 14:35:49
抖音小店運(yùn)營(yíng)和天貓區(qū)別是什么呢

隨著社交媒體的廣泛應(yīng)用,抖音小店開(kāi)始走進(jìn)人們的生活,成為越來(lái)越多人的購(gòu)物選擇之一。而天貓作為國(guó)內(nèi)最具影響力的電商平臺(tái)之一,是許多電商從...詳情>>

2023-10-08 14:23:10
抖音小店在哪個(gè)界面進(jìn)入店鋪?lái)?yè)面

抖音小店,是指在抖音平臺(tái)上開(kāi)設(shè)的個(gè)人或企業(yè)店鋪。隨著抖音用戶數(shù)的不斷增加,抖音小店越來(lái)越受到用戶的歡迎和喜愛(ài)。但是,如何進(jìn)入抖音小店的...詳情>>

2023-10-08 14:21:20
主站蜘蛛池模板: 日本三黄色大| 日本护士xxxx视频| 日韩精品免费在线视频| 打开腿我想亲亲你下面视频| 美女扒开尿口直播| 国产| swag在线观看| 欧美日韩亚洲视频| 日本tvvivodes人妖| 国产精品久久久久9999高清 | 国产精品毛片va一区二区三区| 国色天香精品一卡2卡3卡| 再深点灬舒服了灬太大了乡村 | 国产99久久精品一区二区| 四虎成人影院网址| 国产自产2023最新麻豆| 一级黄色片免费| 18观看免费永久视频| 午夜精品一区二区三区在线观看| 天堂中文字幕在线| 曰批免费视频播放免费| 日韩欧美在线视频| 日本一本高清| 出差被绝伦上司侵犯中文字幕| 一本伊在人香蕉线观新在线| 国产人伦视频在线观看| 成人试看120秒体验区| 涩涩爱影院| 久久国产成人精品国产成人亚洲| 推拿电影完整未删减版资源| 男生和女生一起差差差很痛视频| 丝瓜草莓www在线观看| 日本私人影院| 2021天天干| 亚洲神级电影国语版| 海角社区视频在线| 亚洲成年人专区| 日韩福利在线| 中文字幕在线播放视频| 国色天香社区在线观看免费播放| 欧美区日韩区|