1.機器學習和計算機視覺
Crab:靈活、快速的推薦引擎
gensim:人性化的話題建模庫
hebel:GPU加速的深度學習庫
NuPIC:智能計算Numenta平臺
pattern:Python網絡挖掘模塊
PyBrain:另一個Python機器學習庫
Pylearn2:一個基于Theano的機器學習庫
python-recsys:一個用來實現推薦系統的Python庫
scikit-learn:基于SciPy構建的機器學習Python模塊
pydeep:Python深度學習庫
vowpalporpoise:輕量級VowpalWabbit的Python封裝
skflow:一個TensorFlow的簡化接口(模仿scikit-learn)
Caffe:一個Caffe的python接口
OpenCV:開源計算機視覺庫
pyocr:Tesseract和Cuneiform的包裝庫
pytesseract:GoogleTesseractOCR的另一包裝庫
SimpleCV:一個用來創建計算機視覺應用的開源框架
2.數據分析
blaze:NumPy和Pandas的大數據接口
cclib:一個用來解析和解釋計算化學軟件包輸出結果的庫
NetworkX:一個為復雜網絡設計的高性能軟件
Neupy:執行和測試各種不同的人工神經網絡算法
Numba:PythonJIT(justintime)編譯器,針對科學用的Python,由Cython和NumPy的開發者開發
NumPy:使用Python進行科學計算的基礎包
OpenBabel:一個化學工具箱,用來描述多種化學數據
OpenMining:使用Python挖掘商業情報(BI)(Pandasweb接口)
orange:通過可視化編程或Python腳本進行數據挖掘,數據可視化,分析和機器學習
Pandas:提供高性能,易用的數據結構和數據分析工具
PyDy:PyDy是PythonDynamics的縮寫,用來為動力學運動建模工作流程提供幫助,基于NumPy,SciPy,IPython和matplotlib
PyMC:馬爾科夫鏈蒙特卡洛采樣工具
RDKit:化學信息學和機器學習軟件
SciPy:由一些基于Python,用于數學,科學和工程的開源軟件構成的生態系統
statsmodels:統計建模和計量經濟學
SymPy:一個用于符號數學的Python庫
cclib:一個用來解析和解釋計算化學軟件包輸出結果的庫
NetworkX:一個為復雜網絡設計的高性能軟件
Neupy:執行和測試各種不同的人工神經網絡算法
Numba:PythonJIT(justintime)編譯器,針對科學用的Python,由Cython和NumPy的開發者開發
NumPy:使用Python進行科學計算的基礎包
OpenBabel:一個化學工具箱,用來描述多種化學數據
OpenMining:使用Python挖掘商業情報(BI)(Pandasweb接口)
orange:通過可視化編程或Python腳本進行數據挖掘,數據可視化,分析和機器學習
Pandas:提供高性能,易用的數據結構和數據分析工具
PyDy:PyDy是PythonDynamics的縮寫,用來為動力學運動建模工作流程提供幫助,基于NumPy,SciPy,IPython和matplotlib
PyMC:馬爾科夫鏈蒙特卡洛采樣工具
RDKit:化學信息學和機器學習軟件
SciPy:由一些基于Python,用于數學,科學和工程的開源軟件構成的生態系統
statsmodels:統計建模和計量經濟學
SymPy:一個用于符號數學的Python庫
3.數據可視化
matplotlib:一個Python2D繪圖庫
bokeh:用Python進行交互式web繪圖
ggplot:ggplot2給R提供的API的Python版本
plotly:協同Python和matplotlib工作的web繪圖庫
pyecharts:基于百度Echarts的數據可視化庫
pygal:一個PythonSVG圖表創建工具
pygraphviz:Graphviz的Python接口
PyQtGraph:交互式實時2D/3D/圖像繪制及科學/工程學組件
SnakeViz:一個基于瀏覽器的Python'scProfile模塊輸出結果查看工具
vincent:把Python轉換為Vega語法的轉換工具
VisPy:基于OpenGL的高性能科學可視化工具
4.數據API構建及服務
·Django
django-rest-framework:一個強大靈活的工具,用來構建webAPI
django-tastypie:為Django應用開發API
django-formapi:為Django的表單驗證,創建JSONAPIs
·Flask
flask-api:為flask開發的,可瀏覽WebAPIs
flask-restful:為flask快速創建RESTAPIs
flask-restless:為SQLAlchemy定義的數據庫模型創建RESTfulAPIs
flask-api-utils:為Flask處理API表示和驗證
eve:RESTAPI框架,由Flask,MongoDB等驅動
·Pyramid
cornice:一個Pyramid的REST框架
·與框架無關的
falcon:一個用來建立云API和webapp后端的高性能框架
sandman:為現存的數據庫驅動系統自動創建RESTAPIs
restless:框架無關的REST框架,基于從Tastypie學到的知識
ripozo:快速創建REST/HATEOAS/HypermediaAPIs
5.爬蟲及網頁處理
Scrapy:一個快速高級的屏幕爬取及網頁采集框架
cola:一個分布式爬蟲框架
Demiurge:基于PyQuery的爬蟲微型框架
feedparser:通用feed解析器
Grab:站點爬取框架
MechanicalSoup:用于自動和網絡站點交互的Python庫
portia:Scrapy可視化爬取
pyspider:一個強大的爬蟲系統
RoboBrowser:一個簡單的,Python風格的庫,用來瀏覽網站,而不需要一個獨立安裝的瀏覽器
BeautifulSoup:以Python風格的方式來對HTML或XML進行迭代,搜索和修改
bleach:一個基于白名單的HTML清理和文本鏈接庫
cssutils:一個Python的CSS庫
html5lib:一個兼容標準的HTML文檔和片段解析及序列化庫
lxml:一個非常快速,簡單易用,功能齊全的庫,用來處理HTML和XML
MarkupSafe:為Python實現XML/HTML/XHTML標記安全字符串
pyquery:一個解析HTML的庫,類似jQuery
untangle:將XML文檔轉換為Python對象,使其可以方便的訪問
xhtml2pdf:HTML/CSS轉PDF工具
xmltodict:像處理JSON一樣處理XML
6.算法和設計模式
·Python實現的算法和設計模式。
algorithms:一個Python算法模塊
python-patterns:Python設計模式的集合
sortedcontainers:快速,純Python實現的SortedList,SortedDict和SortedSet類型
以上內容為大家介紹了Python數據分析相關的技術,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。http://www.dietsnews.net/