最近希望使用xgboost在公司內部做一個優化模型,之前一直用R做xgboost參數測試(跑一個參數要用5-6個小時),現在想用python跑一下模型(也希望跑快一點),順便加上一些機器學習的思路來優化參數,在上一家公司曾經也試圖安裝過,鼓搗了一天不過失敗了,這次我毅然繼續跳坑……
廢話少說,這里我重申一下我的所有工具,如果有跟我一樣想在win10下面跑xgboost模型的,可以先看過來:
一、工具下載安裝
1、anaconda2(里面包含了幾乎所有基礎的數據處理包,不用我們再去費勁找程序包來下載)
下載地址:http://www.continuum.io/downloads/
通過百度anaconda可以很容易找到這個鏈接;
2、mingw64(可以通過它編譯文件,最終產生適合win10的安裝包)
下載地址:https://sourceforge.net/PRojects/mingw-w64/files/Toolchains%20targetting%20Win64/Personal%20Builds/mingw-builds/5.3.0/threads-win32/seh/
建議使用mingw-w64-install.exe(960.5 kB)在線下載,目前來說我成功安裝xgboost就是使用的這個自動安裝程序;
3、git bash(可以通過它下載最新的xgboost包,之后還需要編譯后才能使用)
下載地址:https://git-scm.com/download/win
具體安裝選項我沒有變動,一直點下一步就好。
二、工具參數設置(具體見圖示)
1、anaconda2參數:需要將anaconda2主目錄、腳本目錄、庫目錄(D:/anaconda2、D:/anaconda2/Scripts、D:/anaconda2/Library/bin)寫入環境變量
2、mingw64參數:需要將mingw64庫目錄(C:/Program Files/mingw-w64/mingw64/bin)寫入環境變量
三、正式編譯xgboost(注意有許多同學把mingw32-make改為make,我這里沒有做任何修改,大家可以自行調整)
所有工具安裝完畢,環境變量也都設置好之后,跟著我在git bash中輸入如下的命令:
cd c:(將安裝路徑選擇為C盤)
git clone --recursive https://github.com/dmlc/xgboost(將最新的xgboost包下載到當前目錄)
cd xgboost(進入xgboost目錄)
git submodule init(俺也不懂啥意思,初始化?)
git submodule update(更新文檔?)
cp make/mingw64.mk config.mk(將mingw64.mk文件拷到當前目錄下)
mingw32-make -j4(編譯當前目錄,此步會發生部分文件編譯錯誤,下面的命令是將錯誤的文件再編譯一次)
cd dmlc-core(進入dmlc-core目錄)
mingw32-make -j4(對當前目錄進行編譯)
cd ../rabit(進入rabit目錄)
mingw32-make lib/librabit_empty.a -j4(對當前目錄中某一個文件進行編譯)
cd ..(返回上級目錄)
mingw32-make -j4(重新編譯)
cd python-package(進入安裝目錄)
python setup.py install(使用python安裝xgboost包)
最終git bash執行完命令結果如下:
現在趕緊到IDE中去裝載一下xgboost包吧,
import xgboost as xgb
趕緊看看你的安裝是否OK!
文獻參考:http://www.th7.cn/system/win/201603/157092.shtml
http://www.cnblogs.com/yesuuu/p/5941786.html
http://blog.sina.com.cn/s/blog_8c7b838f0102y5z3.html
新聞熱點
疑難解答