• MLPack:官网

    mlpack是一个C++的机器学习库,它重点在于其扩展性、高速性和易用性。它的目的是让新用户通过简单、一致的API使用机器学习,同时为专业用户提供C++的高性能和最大灵活性。他的性能超出大量类似的机器学习库,如WEKA、Shogun、MATLAB、mlpy及sklearn,这一对比工作可以参考文献[1]。

    mlpack含有丰富的文档和教程,可以参考项目主页。教程中包含的算法有:近邻搜索(NeighborSearch)、范围搜索(RangeSearch)、线性回归(LinearRegression)、欧几里德最小生成树(The Euclidean Minimum Spanning Tree)、K-均值(K-Means)、FastMKS(Fast max-kernel search)等。

    mlpack提供了大量的类或API供程序调用,同时还提供了很多可执行程序供不懂C++的用户使用。这些可执行文件包括:allkfn, allknn, emst, gmm, hmm_train, hmm_loglik, hmm_viterbi, hmm_generate, kernel_pca, kmeans, lars, linear_regression, local_coordinate_coding, mvu, nbc, nca, pca, radical, sparse_coding。

    示例代码:

    #include<mlpack/methods/range_search/range_search.hpp>using namespace mlpack::range;// Our dataset matrix, which is column-major.extern arma::mat dataset;// The 'true' option indicates that we will use naive calculation.RangeSearch<> a(dataset, true);// The vector-of-vector objects we will store output in.std::vector> resultingNeighbors;std::vector> resultingDistances;// The range we will use.  The upper bound is DBL_MAX.math::Range r(5.0, DBL_MAX); // [5.0, inf).a.Search(r, resultingNeighbors, resultingDistances)