20個頂尖的Python機(jī)器學(xué)習(xí)開源項(xiàng)目,鑄就人工智能基礎(chǔ)
來源:
奇酷教育 發(fā)表于:
2017-04-26 11:22:01
在GitHub上用Python語言機(jī)器學(xué)習(xí)的項(xiàng)目,圖中顏色所對應(yīng)的Bob, Iepy, Nilearn, 和NuPIC擁有最高的價(jià)值。 1 Scikit-learn
在GitHub上用Python語言機(jī)器學(xué)習(xí)的項(xiàng)目,圖中顏色所對應(yīng)的Bob, Iepy, Nilearn, 和NuPIC擁有最高的價(jià)值。
1. Scikit-learn
www.github.com/scikit-learn/scikit-learn
Scikit-learn 是基于Scipy為機(jī)器學(xué)習(xí)建造的的一個Python模塊,他的特色就是多樣化的分類,回歸和聚類的算法包括支持向量機(jī),邏輯回歸,樸素貝葉斯分類器,隨機(jī)森林,Gradient Boosting,聚類算法和DBSCAN。而且也設(shè)計(jì)出了Python numerical和scientific libraries Numpy and Scipy
2.Pylearn2
www.github.com/lisa-lab/pylearn2
Pylearn是一個讓機(jī)器學(xué)習(xí)研究簡單化的基于Theano的庫程序。
3.NuPIC
www.github.com/numenta/nupic
NuPIC是一個以HTM學(xué)習(xí)算法為工具的機(jī)器智能平臺。HTM是皮層的精確計(jì)算方法。HTM的核心是基于時(shí)間的持續(xù)學(xué)習(xí)算法和儲存和撤銷的時(shí)空模式。NuPIC適合于各種各樣的問題,尤其是檢測異常和預(yù)測的流數(shù)據(jù)來源。
4. Nilearn
www.github.com/nilearn/nilearn
Nilearn 是一個能夠快速統(tǒng)計(jì)學(xué)習(xí)神經(jīng)影像數(shù)據(jù)的Python模塊。它利用Python語言中的scikit-learn 工具箱和一些進(jìn)行預(yù)測建模,分類,解碼,連通性分析的應(yīng)用程序來進(jìn)行多元的統(tǒng)計(jì)。
5.PyBrain
www.github.com/pybrain/pybrain
Pybrain是基于Python語言強(qiáng)化學(xué)習(xí),人工智能,神經(jīng)網(wǎng)絡(luò)庫的簡稱。 它的目標(biāo)是提供靈活、容易使用并且強(qiáng)大的機(jī)器學(xué)習(xí)算法和進(jìn)行各種各樣的預(yù)定義的環(huán)境中測試來比較你的算法。
6.Pattern
www.github.com/clips/pattern
Pattern 是Python語言下的一個網(wǎng)絡(luò)挖掘模塊。它為數(shù)據(jù)挖掘,自然語言處理,網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)提供工具。它支持向量空間模型、聚類、支持向量機(jī)和感知機(jī)并且用KNN分類法進(jìn)行分類。
7.Fuel
www.github.com/mila-udem/fuel
Fuel為你的機(jī)器學(xué)習(xí)模型提供數(shù)據(jù)。他有一個共享如MNIST, CIFAR-10 (圖片數(shù)據(jù)集), Google's One Billion Words (文字)這類數(shù)據(jù)集的接口。你使用他來通過很多種的方式來替代自己的數(shù)據(jù)。
8.Bob
www.github.com/idiap/bob
Bob是一個免費(fèi)的信號處理和機(jī)器學(xué)習(xí)的工具。它的工具箱是用Python和C++語言共同編寫的,它的設(shè)計(jì)目的是變得更加高效并且減少開發(fā)時(shí)間,它是由處理圖像工具,音頻和視頻處理、機(jī)器學(xué)習(xí)和模式識別的大量軟件包構(gòu)成的。
9.Skdata
www.github.com/jaberg/skdata
Skdata是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的數(shù)據(jù)集的庫程序。這個模塊對于玩具問題,流行的計(jì)算機(jī)視覺和自然語言的數(shù)據(jù)集提供標(biāo)準(zhǔn)的Python語言的使用。
10.MILK
www.github.com/luispedro/milk
MILK是Python語言下的機(jī)器學(xué)習(xí)工具包。它主要是在很多可得到的分類比如SVMS,K-NN,隨機(jī)森林,決策樹中使用監(jiān)督分類法。 它還執(zhí)行特征選擇。 這些分類器在許多方面相結(jié)合,可以形成不同的例如無監(jiān)督學(xué)習(xí)、密切關(guān)系金傳播和由MILK支持的K-means聚類等分類系統(tǒng)。
11.IEPY
www.github.com/machinalis/iepy
IEPY是一個專注于關(guān)系抽取的開源性信息抽取工具。它主要針對的是需要對大型數(shù)據(jù)集進(jìn)行信息提取的用戶和想要嘗試新的算法的科學(xué)家。
12.Quepy
www.github.com/machinalis/quepy
Quepy是通過改變自然語言問題從而在數(shù)據(jù)庫查詢語言中進(jìn)行查詢的一個Python框架。他可以簡單的被定義為在自然語言和數(shù)據(jù)庫查詢中不同類型的問題。所以,你不用編碼就可以建立你自己的一個用自然語言進(jìn)入你的數(shù)據(jù)庫的系統(tǒng)。
現(xiàn)在Quepy提供對于Sparql和MQL查詢語言的支持。并且計(jì)劃將它延伸到其他的數(shù)據(jù)庫查詢語言。
13.Hebel
www.github.com/hannes-brt/hebel
Hebel是在Python語言中對于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的一個庫程序,它使用的是通過PyCUDA來進(jìn)行GPU和CUDA的加速。它是最重要的神經(jīng)網(wǎng)絡(luò)模型的類型的工具而且能提供一些不同的活動函數(shù)的激活功能,例如動力,涅斯捷羅夫動力,信號丟失和停止法。
14.mlxtend
www.github.com/rasbt/mlxtend
它是一個由有用的工具和日常數(shù)據(jù)科學(xué)任務(wù)的擴(kuò)展組成的一個庫程序。
15.nolearn
www.github.com/dnouri/nolearn
這個程序包容納了大量能對你完成機(jī)器學(xué)習(xí)任務(wù)有幫助的實(shí)用程序模塊。其中大量的模塊和scikit-learn一起工作,其它的通常更有用。
16.Ramp
www.github.com/kvh/ramp
Ramp是一個在Python語言下制定機(jī)器學(xué)習(xí)中加快原型設(shè)計(jì)的解決方案的庫程序。他是一個輕型的pandas-based機(jī)器學(xué)習(xí)中可插入的框架,它現(xiàn)存的Python語言下的機(jī)器學(xué)習(xí)和統(tǒng)計(jì)工具(比如scikit-learn,rpy2等)Ramp提供了一個簡單的聲明性語法探索功能從而能夠快速有效地實(shí)施算法和轉(zhuǎn)換。
17.Feature Forge
www.github.com/machinalis/featureforge
這一系列工具通過與scikit-learn兼容的API,來創(chuàng)建和測試機(jī)器學(xué)習(xí)功能。
這個庫程序提供了一組工具,它會讓你在許多機(jī)器學(xué)習(xí)程序使用中很受用。當(dāng)你使用scikit-learn這個工具時(shí),你會感覺到受到了很大的幫助。(雖然這只能在你有不同的算法時(shí)起作用。)
18.REP
www.github.com/yandex/rep
REP是以一種和諧、可再生的方式為指揮數(shù)據(jù)移動驅(qū)動所提供的一種環(huán)境。
它有一個統(tǒng)一的分類器包裝來提供各種各樣的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一個群體以平行的方式訓(xùn)練分類器。同時(shí)它也提供了一個交互式的情節(jié)。
19.Python 學(xué)習(xí)機(jī)器樣品
www.github.com/awslabs/machine-learning-samples
用亞馬遜的機(jī)器學(xué)習(xí)建造的簡單軟件收集。
20.Python-ELM
www.github.com/dclambert/Python-ELM
這是一個在Python語言下基于scikit-learn的極端學(xué)習(xí)機(jī)器的實(shí)現(xiàn)。
從目前來看,深度學(xué)習(xí)領(lǐng)域基本上所有的代碼都是C++和Python,其他語言一般只有幾千行。如果講運(yùn)行速度的部分,用C++,如果講開發(fā)效率,用Python,誰會用Java這種高不成低不就的語言搞人工智能呢?Python雖然是腳本語言,但是因?yàn)槿菀讓W(xué),迅速成為科學(xué)家的工具(MATLAB也能搞科學(xué)計(jì)算,但是軟件要錢,且很貴),從而積累了大量的工具庫、架構(gòu),人工智能涉及大量的數(shù)據(jù)計(jì)算,用Python是很自然的,簡單高效。Python有非常多優(yōu)秀的深度學(xué)習(xí)庫可用,現(xiàn)在大部分深度學(xué)習(xí)框架都支持Python。
奇酷教育Python課程將主要講授Python基礎(chǔ)知識,穿插講解Python的最佳實(shí)踐,讓學(xué)員不僅僅學(xué)會編程的基本語法,還能學(xué)到資深工程師的編程經(jīng)驗(yàn),了解一線互聯(lián)網(wǎng)公司用到的Python工具和開源項(xiàng)目,熟悉Python高手的編程風(fēng)格。
奇酷教育師資力量強(qiáng),一線名企工程師授課,授課老師教學(xué)經(jīng)驗(yàn)豐富,深入淺出講解,學(xué)習(xí)輕松、高效。參加奇酷教育Python班的學(xué)員還可以了解到互聯(lián)網(wǎng)公司的協(xié)作方式,開發(fā)流程和Python應(yīng)用。
零基礎(chǔ)入門到精通,幫助學(xué)員從零基礎(chǔ)學(xué)會Python編程,豐富的知識擴(kuò)展,讓學(xué)員收獲的不僅僅是Python,更重要的是傳授學(xué)員編程中最佳實(shí)踐和編程高手的思考方式,引導(dǎo)學(xué)員學(xué)會高質(zhì)量編程,直達(dá)中高級水平。