Julia で Numerai にチャレンジ
Numerai というデータサイエンスが競い合って、効率の良いファウンドを運営しようという試み。
ビットコインで雇われた匿名の7,500人が「頭脳」となるヘッジファンド「Numerai」|WIRED.jp
良いデータを登録できると、報酬ももらえるので頑張って Julia で挑戦してみる。
using DataFrames
using DecisionTree
using ScikitLearn
train = readtable("./numerai_training_data.csv")
test = readtable("./numerai_tournament_data.csv")
yTrain_array = Array(train[:, :target] * 1.0)
xTrain_array = Array(train[:,4:53])
model = RandomForestRegressor()
ScikitLearn.fit!(model, xTrain_array, yTrain_array)
predTest = ScikitLearn.predict(model, Array(test[:,4:53]))
labelsInfoTest = DataFrame()
labelsInfoTest[:id] = test[:id]
labelsInfoTest[:probability] = predTest
writetable("numerai_predict.csv", labelsInfoTest, separator=',', header=true)
とりあえず、simpleなランダムフォレストを作って登録もできた。Loglossは0.76522ぐらいだった。