scikit-learn庫是什么?Python的開源社區非常活躍,也有很多和Java等開源語言一樣的框架或庫體系,其中Scikit-learn(簡寫成sklearn)是最著名的Python機器學習庫之一。官方網址為http://scikit-learn.org/stable/。
sklearn基于BSD開源許可證,最早由David Cournapeau在2007年發起,目前也是由社區自愿者進行維護,經年累月,整個項目的內容已經相當豐富了,目前最新的穩定版是0.17版本。
用戶手冊內容也很友好,覆蓋面很全,包括有監督的學習(分類)、無監督的學習(聚類)、模型選擇與評價、數據集轉換、數據集提取應用(數據示例下載)、大規模計算策略、計算效率七大部分。
機器學習算法大多使用sklearn庫完成,主要涉及Supervised learning和Unsupervised learning兩個部分,相信它也能幫助讀者在生產生活中很大程度地提高生產效率。
在安裝sklearn之前請確認Python已經安裝。安裝Python的方法見附錄C。
如果發現Python軟件未被正確安裝,可以使用CentOS系統自帶的包管理工具“yum”進行安裝。安裝方法如下:
然后安裝sklearn。sklearn的安裝很簡單,只要能夠連接上互聯網,直接使用pip安裝即可: