这是一个用c++实现的随机森林目前只适用于特征是0/1,分类也只有0/1的数据. 0.依赖: -g++/clang, mpich, cmake
1.运行: sh run.sh - 对data/train.txt 中抽取的200000行数据训练500棵树,并完成对data/test.txt的预测,并输出预测准确率
2.数据格式:
-训练/测试数据
#分类 #特征1 #特征2 ...\n
用空格分隔特征,用换行分隔样例
-输出的预测数据
第一行 `id label`
后面是对每行数据的预测分类 `#行号,#分类\n`