一、怎么利用hadoop搭建自己的云計算
(1) 我們為了能夠更加方便來識別主機,我們使用主機名而不是使用IP地址,以免多處配置帶來更多的麻煩。把hd-master、hd-node1、hd-node2三臺虛擬機服務器中的主機名(hostname)分別更改為master、node1、node2。
命令如下:
cd /etc/?? // 進入配置目錄
vi hostname? // 編程hostname 配置文件
先點擊 Esc : wq 保存
在另外兩個節點上進行相同的操作
(2) 開啟主機的DHCP模式,自動獲取ip地址。方法如下:
cd /etc/sysconfig/network-scripts/?????????? //進入網卡編輯目錄
vi ifcfg-enp16777736???????????????????????? //編輯網卡enp0s3的配置文件
重啟網卡 service network restart
(3) 配置hosts
配置 hosts 主要是為了讓機器能夠相互識別主機
注:hosts文件是域名解析文件,在hosts文件內配置了 ip地址和主機名的對應關系,配置之后,通過主機名,電腦就可以定位到相應的ip地址 。
vi /etc/hosts
在hosts配置文件內容輸入如下內容:使用同樣的方式更改node1和node2的網卡配置。
(4) ssh 免密登錄
ssh? 一路回車
?ssh-keygen
使用如下命令將公鑰復制要node1和node2節點中:
ssh-copy-id root@node1
ssh-copy-id root@localhost
ssh-copy-id root@node2
使用 ssh node1 實驗是否能免密登錄
注意:ssh免密設置后會在如下目錄生成四個文件
(5) JDK環境安裝(環境配置好后, 拷貝帶其他節點)
在 master 中新建目錄 /opt/bigdata/, 此目錄下存放 hadoop 大數據所需要的環境包.
把下載好的JDK包和hadoop上傳至master主機中,JDK是安裝Hadoop的基礎環境,所以需要優先安裝好JDK環境(較好把包考到opt目錄下下)
??????? 連接好后將文件拖到opt目錄下即可
解壓 JDK 并配置環境變量
tar -zxvf jdk-8u181-linux-x64.tar.gz
?mv jdk1.8.0_181/ bigdata/
然后我們配置環境變量
vi /etc/profile
source /etc/profile??
java -version?????? #驗證環境是否配置成功
(6)Hadoop 安裝(環境配置好后, 拷貝帶其他節點)
把 hadoop 的壓縮包解壓在當前文件夾然后移動到 bigdata 目錄下
tar -zxvf hadoop-3.1.1.tar.gz
mv hadoop-3.1.1 bigdata/
配置 hadoop 環境變量
注:環境變量是讓系統變量,在環境變量配置的命令目錄后,該目錄的命令將可以在任何位置都可以使用。
source profile
hadoop verison
配置 hadoop
cd /opt/bigdata/hadoop-3.1.1/etc/hadoop/
我們需要對?? core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml進行配置
(1) 配置 hadoop-env.sh
編輯hadoop-env.sh文件。
命令如下:
vi hadopp-env.sh
查找JAVA_HOME 配置的位置
:/export JAVA_HOME
輸入JAVA_HOME的絕對路徑。
export JAVA_HOME=/opt/bigdata/jdk1.8.0_181???? (要把前面的注釋#去掉)
延伸閱讀:
二、什么是數據庫和數據庫管理系統
數據庫的應用非常廣泛,舉個例子,我們平時在瀏覽器上搜索內容,就要用到數據庫去檢索我們的關鍵字。以前我們可能會用數組、集合、文件等來存儲數據,但是接下來我們就會面臨一個問題,當存儲的數據或內容過多的時候,我們如何去精準的找到我們需要的東西,這時候數據庫管理系統就派上了用場。除此之外,數據庫管理系統還能永久的儲存我們的數據。
為了便于大家理解,這里先給大家講解幾個概念
DB數據庫(database):存儲數據的“倉庫”。它保存了一系列有組織的數據。
DBMS數據庫管理系統(Database Management System):數據庫是通過DBMS創建和操作的容器。