上天台百度云:libsvm 2.6 的代码中文注释

来源：百度文库编辑：中财网时间：2024/05/10 02:48:17

这是我在网上找的pdf转成txt的。希望对触svm的新手有点帮助.上海交通大学模式分析与机器智能实验室LibSVM-2.6 程序代码注释上海交通大学模式分析与机器智能实验室我不经心地，服下你调好的毒我知道今后我...

这是我在网上找的pdf转成txt的。希望对触svm的新手有点帮助.

上海交通大学模式分析与机器智能实验室

LibSVM-2.6 程序代码注释

上海交通大学模式分析与机器智能实验室

我不经心地，服下你调好的毒

我知道今后我将万劫不复

但是你的红唇仍让我屈服

四月的樱花火红满天

我和你的梦，却要一以何处去缱绻？

虽然人间的情爱万万千千

世上已有太多崩毁的誓言

七个黑夜，七个白天

我为你写下的歌，彩绘的纸笺

却只能随着晚风

飘在大海的岸边

我仍愿服下你精心为我调好的毒

从你那深情的吻

吞下我与你在人间

最后的流光万千辗转朱颜……

上海交通大学模式分析与机器智能实验室

第一节： SVM.h 文件

struct svm_node

{

int index;

double value;

}

;

struct svm_node 用来存储单一向量中的单个特征，例如

：

向量x1={ 0.002, 0.345, 4, 5.677}

;

那么用struct svm_node 来存储时就使用一个包含5 个svm_node 的数组来存储此4 维向量，内

存

映象如下

：

1 2 3 4 －1

0.002 0.345 4．000 5.677 空

其中如果value 为0.00,该特征将不会被存储，其中(特征3)被跳过：

1 2 4 5 －1

0.002 0.345 4．000 5.677 空

0.00 不保留的好处在于，做点乘的时候，可以加快计算速度，对于稀疏矩阵，更能充分体现这种

数据结构的优势。但做归一化时，操作就比较麻烦了。

（类型转换不再说明）

struct svm_problem

{

int l;

double *y;

struct svm_node **x;

};

struct svm_problem 存储本次参加运算的所有样本（数据集），及其所属类别。在某些数据挖掘

实现中，常用DataSet来实现。

int l; 记录样本总数

double *y; 指向样本所属类别的数组。在多类问题中，因为使用了one-agianst-one 方法，可能原始

样本中y[i] 的内容是1.0，2.0，3.0，…,但参与多类计算时，参加分类的两类所对应的y[i] 内容是+1,

和－1。

Struct svm_node **x;指向一个存储内容为指针的数组；

如下图,最右边的四个长条格同上表，存储三维数据。(黑边框的是最主要的部分)

Y[3]

Y[2]

Y[1]

Y[0]

上海交通大学模式分析与机器智能实验室

这样的数据结构有一个直接的好处，可以用x[i][j] 来访问其中的某一元素（如果value 为0.00

的也全部保留的话）

私下认为其中有一个败笔，就是把svm_node* x_space 放到结构外面去了。

enum { C_SVC, NU_SVC, ONE_CLASS, EPSILON_SVR, NU_SVR };/* svm_type */

enum { LINEAR, POLY, RBF, SIGMOID }; /* kernel_type */

struct svm_parameter

{

int svm_type;//SVM类型，见前enum

int kernel_type;//核函数

double degree; /* for poly */

double gamma;/* for poly/rbf/sigmoid */

double coef0; /* for poly/sigmoid */

/* these are for training only */

double cache_size; /* in MB *

double eps; /* stopping criteria *

double C; /* for C_SVC, EPSILON_SVR and NU_SVR *

int nr_weight; /* for C_SVC *

int *weight_label; /* for C_SVC *

double* weight; /* for C_SVC *

double nu; /* for NU_SVC, ONE_CLASS, and NU_SVR *

double p; /* for EPSILON_SVR *

int shrinking; /* use the shrinking heuristics *

int probability; /* do probability estimates *

}

;

部分参数解释,(附核函数

)

1、K (xi , xj )

xiT x j

2、K (xi , xj )

(γxiTx j

r)d ,γ>

3、K (xi , xj )

exp(.

),γ>

4、K (xi , xj )

tanh(γxiT x j

double degree;//就是2式中的d

double gamma; //就是2,3,4式中的gamma

double coef0;//就是2,4式中的r

double cache_size; /* in MB */ 制定训练所需要的内存，默认是40M，LibSVM2.5 中是4M, 所以自

己做开发选LibSVM2.5 还是不错的！

double eps;见参考文献[1]中式3.13

double C;//没什么好说的，惩罚因子，越大训练的模型越那个…,当然耗的时间越多

上海交通大学模式分析与机器智能实验室

int nr_weight;//权重的数目,目前在实例代码中只有两个值，一个是默认0，另外一个是

svm_binary_svc_probability 函数中使用数值2。

int *weight_label;//权重，元素个数由nr_weight 决定.

double nu;// 没什么好说的,too

double p;// 没什么好说的,three

int shrinking;//指明训练过程是否使用压缩。

int probability;//新增，指明是否要做概率估计

struct svm_model

{

svm_parameter param; // parameter

int nr_class; // number of classes, = 2 in regression/one class svm

int l; // total #SV

svm_node **SV; // SVs (SV[l])

double **sv_coef; // coefficients for SVs in decision functions (sv_coef[n-1][l])

double *rho; // constants in decision functions (rho[n*(n-1)/2])

double *probA; // pariwise probability information

double *probB;

// for classification only

int *label; // label of each class (label[n])

int *nSV; // number of SVs for each class (nSV[n])

// nSV[0] + nSV[1] + ... + nSV[n-1] = l

// XXX

int free_sv; // 1 if svm_model is created by svm_load_model

// 0 if svm_model is created by svm_train

};

结构体svm_model 用于保存训练后的训练模型，当然原来的训练参数也必须保留。

svm_parameter param; // 训练参数

int nr_class;// 类别数

int l; // 支持向量数

svm_node **SV; // 保存支持向量的指针，至于支持向量的内容，如果是从文件中读取，内容会

额外保留；如果是直接训练得来，则保留在原来的训练集中。如果训练完成后需要预报，原来的

训练集内存不可以释放。

double **sv_coef;//相当于判别函数中的alpha

double *rho; //相当于判别函数中的b

double *probA; // pariwise probability information

double *probB;//均为新增函数

int *label; // label of each class (label[n])

int *nSV; // number of SVs for each class (nSV[n])

int free_sv;//见svm_node **SV的注释

上海交通大学模式分析与机器智能实验室

//以下接口函数设计得非常合理，最后一节详细说

明

//最主要的驱动函数，训练数

据

struct svm_model *svm_train(const struct svm_problem *prob, const struct svm_parameter *param)

;

//用SVM做交叉验

证

void svm_cross_validation(const struct svm_problem *prob, const struct svm_parameter *param, int

nr_fold, double *target)

;

//保存训练好的模型到文

件

int svm_save_model(const char *model_file_name, const struct svm_model *model)

;

//从文件中把训练好的模型读到内存

中

struct svm_model *svm_load_model(const char *model_file_name)

;

int svm_get_svm_type(const struct svm_model *model)

;

//得到数据集的类别数（必须经过训练得到模型后才可以用

）

int svm_get_nr_class(const struct svm_model *model)

;

//得到数据集的类别标号（必须经过训练得到模型后才可以用

）

void svm_get_labels(const struct svm_model *model, int *label)

;

//LibSvm2.6 新增函

数

double svm_get_svr_probability(const struct svm_model *model)

;

//用训练好的模型预报样本的值，输出结果保留到数组中。（并非接口函数

）

void svm_predict_values(const struct svm_model *model, const struct svm_node *x, double*

dec_values)

;

//预报某一样本的

值

double svm_predict(const struct svm_model *model, const struct svm_node *x)

;

// LibSvm2.6 新增函

数

double svm_predict_probability(const struct svm_model *model, const struct svm_node *x, double*

prob_estimates)

;

//消除训练的模型，释放资

源

void svm_destroy_model(struct svm_model *model)

;

// LibSvm2.6 新增函

数

void svm_destroy_param(struct svm_parameter *param)

;

//检查输入的参数，保证后面的训练能正常进行。

上海交通大学模式分析与机器智能实验室

const char *svm_check_parameter(const struct svm_problem *prob, const struct svm_parameter

*param)

;

// LibSvm2.6 新增函

数

int svm_check_probability_model(const struct svm_model *model)

;

上海交通大学模式分析与机器智能实验室

第二节： SVM.cpp 文件

.头文件：

从整个.cpp 文件来看，感觉有些头文件是多余的，不知何故，反正多包含头文件不会犯错。

后面的typedef, 特别是typedef float Qfloat, 是为了方便控制内存存储的精度。

#include

#include "svm.h"

typedef float Qfloat;

typedef signed char schar;

//.以下是定义的几个主要的模板，主要是为了比较大小，交换数据和完全复制数据。

Min() 和Max() 在中提供了相应的函数，这里的处理，估计是为了使函数内联，执行速度

会相对快一些，而且不同的数据类型，存储方式不同，使用模板会更有针对性，也从另外一方面

提高程序性能。

#ifndef min

template inline T min(T x,T y) { return (x

#endif

#ifndef max

template inline T max(T x,T y) { return (x>y)?x:y; }

#endif

template inline void swap(T& x, T& y) { T t=x; x=y; y=t; }

//这里的克隆函数是完全克隆，不同于一般的复制。操作结束后，内部的所有数据和指针完全一

样。

template inline void clone(T*& dst, S* src, int n)

{

dst = new T[n];

memcpy((void *)dst,(void *)src,sizeof(T)*n);

}

//这里使用了define ，非内联函数

#define INF HUGE_VAL

#define Malloc(type,n) (type *)malloc((n)*sizeof(type)

)

上海交通大学模式分析与机器智能实验室

//以下的函数用作调试。跳过～

#if 1

void info(char *fmt,...)

{

va_list ap;

va_start(ap,fmt)

;

vprintf(fmt,ap)

;

va_end(ap)

;

}

void info_flush()

{

fflush(stdout);

}

#elsevoid info(char *fmt,...) {}

void info_flush() {}

#endif

//以下部分为svm.cpp 中的类继承和组合图: (实线表示继承关系，虚线表示组合关系)

Cache

Kernel

ONE_CLASS_

SVC_

SVR_

Solver

Solver_NU

2.1 类Cache

本类主要负责运算所涉及的内存的管理，包括申请、释放等。

类定义:

class Cache

{

public:

Cache(int l,int size);

~Cache();

int get_data(const int index, Qfloat **data, int len);

void swap_index(int i, int j); // future_option

private:

int l;

int size;

struct head_t

{

上海交通大学模式分析与机器智能实验室

head_t *prev, *next; // a cicular list

Qfloat *data;

int len; // data[0,len) is cached in this entry

};

head_t* head;

head_t lru_head;

void lru_delete(head_t *h);

void lru_insert(head_t *h);

};

成员变量：

head_t* head; // 变量指针，该指针用来记录程序所申请的内存，单块申请到的内存用struct

head_t来记录所申请内存的指针，并记录长度。而且通过双向的指针，形成链表，增加寻址的速

度。记录所有申请到的内存，一方面便于释放内存，另外方便在内存不够时适当释放一部分已经

申请到的内存。

head_t lru_head; //双向链表的头。

int l; //样本总数。

int size; //所指定的全部内存，据说用Mb做单位。

成员函数：

void lru_delete(head_t *h); //从双向链表中删除某个元素的链接，不删除、不释放该元素所

涉及的内存。一般是删除当前所指向的元素。

void lru_insert(head_t *h); //在链表后面插入一个新的链接；

Head

Lru_head

Cache(int l,int size);

构造函数。该函数根据样本数L，申请L 个head_t 的空间。根据说明，该区域会初始化为0，

（表示怀疑）。Lru_head 因为尚没有head_t 中申请到内存，故双向链表指向自己。至于size 的

处理，先将原来的byte 数目转化为float 的数目，然后扣除L 个head_t 的内存数目。size 为程序

指定的内存大小4M/40M 。size 不要设得太小。

int get_data(const int index, Qfloat **data, int len);

该函数保证head_t[index] 中至少有len 个float 的内存，并且将可以使用的内存块的指针放在

data 指针中。返回值为申请到的内存。

函数首先将head_t[index] 从链表中断开,如果head_t[index] 原来没有分配内存，则跳过断开这

步。计算当前head_t[index] 已经申请到的内存，如果不够，释放部分内存（怀疑这样做的动机：

老数据为什么就可以释放，而不真的另外申请一块？老数据没用了？），等内存足够后，重新分

配内存。重新使head_t[index] 进入双向链表。并返回申请到的内存的长度。

//返回值不为申请到的内存的长度，为head_t[index] 原来的数据长度h->len 。

上海交通大学模式分析与机器智能实验室

调用该函数后，程序会计算Q =

∑

yiy jK (xi , xj ) 的值，并将其填入data 所指向的内存区

域，如果下次index 不变，正常情况下，不用重新计算该区域的值。若index 不变，则get_data()

返回值len 与本次传入的len 一致，从Kernel::get_Q( ) 中可以看到，程序不会重新计算。从而提

高运算速度。

While 循环内的部分基本上难得用到一次。

void swap_index(int i, int j);

交换head_t[i] 和head_t[j] 的内容，先从双向链表中断开，交换后重新进入双向链表中。对后

面的处理不理解，可能是防止中head_t[i] 和head_t[j] 可能有一方并未申请内存。但h->len > i 和

h->len > j 无法解释。

for(head_t *h = lru_head.next; h!=&lru_head; h=h->next)

{

if(h->len > i)

{

if(h->len > j)

swap(h->data[i],h->data[j])

;

else

{

// give up

lru_delete(h)

;

free(h->data)

;

size += h->len;

h->data = 0;

h->len = 0;

}

2.2 类Kernel

class Kernel {

public:

Kernel(int l, svm_node * const * x, const svm_parameter& param);

virtual ~Kernel();

static double k_function(const svm_node *x, const svm_node *y, const svm_parameter& param)

;

virtual Qfloat *get_Q(int column, int len) const = 0;

virtual void swap_index(int i, int j) const // no so const..

{

swap(x[i],x[j]);

if(x_square) swap(x_square[i],x_square[j]);

}

protected:

double (Kernel::*kernel_function)(int i, int j) const;

上海交通大学模式分析与机器智能实验室

private:

const svm_node **x;

double *x_square;

// svm_parameter

const int kernel_type;

const double degree;

const double gamma;

const double coef0;

static double dot(const svm_node *px, const svm_node *py)

;

double kernel_linear(int i, int j) const(skipped)

double kernel_poly(int i, int j) const(skipped)

double kernel_rbf(int i, int j) const(skipped)

double kernel_sigmoid(int i, int j) const(skipped)

};

成员变量：

const svm_node **x; // 用来指向样本数据，每次数据传入时通过克隆函数来实现，完全重新

分配内存，主要是为处理多类着想。

double *x_square; //使用RBF 核才使用。

const int kernel_type; //核函数类型.

const double degree; // kernel_function

const double gamma; // kernel_function

const double coef0; // kernel_function

成员函数：

Kernel(int l, svm_node * const * x, const svm_parameter& param);

构造函数。初始化类中的部分常量、指定核函数、克隆样本数据。如果使用RBF 核函数，

则计算x-sqare[i].

static double dot(const svm_node *px, const svm_node *py);

点乘两个样本数据，按svm_node 中index ( 一般为特征)进行运算，一般来说，index 中1，2，…

直到-1。返回点乘总和。

例如：x1 = { 1,2,3} , x2 = {4, 5, 6} 总和为sum = 1*4 + 2*5 + 3*6 ; 在svm_node[3] 中存储index

= -1 时，停止计算。

static double k_function(const svm_node *x, const svm_node *y, const svm_parameter& param);

核函数。但只有在预报时才用到。

其中RBF 部分很有讲究。因为存储时，0 值不保留。如果所有0 值都保留，第一个while

就可以都做完了；如果第一个while 做不完，在x，y 中任意一个出现index ＝ -1，第一个while

就停止，剩下的代码中两个while 只会有一个工作，该循环直接把剩下的计算做完。

上海交通大学模式分析与机器智能实验室

virtual Qfloat *get_Q(int column, int len) const = 0;

纯虚函数，将来在子类中实现。相当重要的函数。

virtual void swap_index(int i, int j)

虚函数，x[i] 和x[j]中所存储指针的内容。如果x_square 不为空，则交换相应的内容

。

double (Kernel::*kernel_function)(int i, int j) const;

函数指针，根据相应的核函数类型，来决定所使用的函数。在计算矩阵Q 时使用

。

Q =

∑

yiy jK(xi , xj )

1、K (xi , xj )

xiT x j

2、K (xi , xj )

(γxiTx j

r)d ,γ>

3、K (xi , xj )

exp(.

),γ>

4、K (xi , xj )

tanh(γxiT x j

2.2 类Solver

class Solver {

public:

Solver() {};

virtual ~Solver() {};

struct SolutionInfo

{

double obj;

double rho;

double upper_bound_p;

double upper_bound_n;

double r; // for Solver_NU

};

void Solve(int l, const Kernel& Q, const double *b_, const schar *y_

double *alpha_, double Cp, double Cn, double eps,

SolutionInfo* si, int shrinking)

;

protected:

int active_size;

schar *y;

double *G; // gradient of objective function

enum { LOWER_BOUND, UPPER_BOUND, FREE };

char *alpha_status; // LOWER_BOUND, UPPER_BOUND, FREE

double *alpha;

上海交通大学模式分析与机器智能实验室

const Kernel *Q;

double eps;

double Cp,Cn;

double *b;

int *active_set;

double *G_bar; // gradient, if we treat free variables as 0

int l;

bool unshrinked; // XXX

double get_C(int i) {

}

void update_alpha_status(int i) {

}

bool is_upper_bound(int i) { return alpha_status[i] == UPPER_BOUND;

}

bool is_lower_bound(int i) { return alpha_status[i] == LOWER_BOUND;

}

bool is_free(int i) { return alpha_status[i] == FREE;

}

void swap_index(int i, int j)

;

void reconstruct_gradient()

;

virtual int select_working_set(int &i, int &j)

;

virtual double calculate_rho()

;

virtual void do_shrinking()

;

};

成员变量：

int active_size; // 计算时实际参加运算的样本数目，经过shrink 处理后，该数目会小于全部

样本总数。

schar *y; //样本所属类别，该值只取+1/-1 。虽然可以处理多类，最终是用两类SVM 完成的。

double *G; //梯度，计算公式如下(公式3.5)[1]

：

(Qα+

p)t =.f (α)t

在代码实现中，用b[i] 来代替公式中的p。

char *alpha_status; //α[i]的状态，根据情况分为α[i]

≤

0, α[i]

≥

c 和0 <α[i]

0 ，分别

对应内部点(非SV)，错分点(BSV)和支持向量(SV)。

double *alpha; //αi

const Kernel *Q; //指定核。核函数和Solver 相互结合，可以产生多种SVC,SVR

double eps; //误差限

double *b; //见double *G 的说明。

int *active_set; //

double *G_bar; // G ,（这名字取的）。计算公式如下：

C ΣQij ,i

1,...,l

j =C

该值可以在对样本集做shrink 时，减小重建梯度的计算量。

上海交通大学模式分析与机器智能实验室

∑

Qijαj =Σ(l) Qijα

0<α<>< p="">

int l; //样本总

数

bool unshrinked; /

成员函数：

double get_C(int i)

返回对应于样本的C。设置不同的Cp 和Cn 是为了处理数据的不平衡。见《 6 Unbalanced

data 》[1]，有时Cp=Cn 。

void swap_index(int i, int j)

;

完全交换样本i 和样本j 的内容，包括所申请的内存的地址

。

void reconstruct_gradient();

重新计算梯度。G_bar[i] 在初始化时并未加入b[i] ，所以程序首先增加b[i] 。Shrink 后依然参

加运算的样本位于active_size 和L-1 位置上。在0～active_size 之间的alpha[i] 如果在区间(0,c) 上，

才有必要更新相应的active_size 和L-1 位置上的样本的梯度。

virtual int select_working_set(int &i, int &j)

选择工作集。公式如下：

≡

argmax({..f (α)t | yt

1,αt

C},{.f (α)t | yt =.1,αt

≡

argmin({.f (α)t | yt =.1,αt

C},{..f (α)t | yt

1,αt

virtual void do_shrinking();

对样本集做缩减。大致是当0 <

α <

C 时，(还有两种情况)程序认为该样本可以不参加下次

迭代。（0 <

α <

C 时，为内部点）程序会减小active_size，为（内部点）增加位置。active_size

表明了不可以参加下次迭代的样本的最小标号，在active_size 与L 之间的元素都对分类没有贡

献。

程序中k--是为了消除交换后的影响，使重新换来的样本也被检查一次。

如果程序在缩减一次后没有达到结束条件，就重新构造梯度矢量，并再缩减一次（总觉得这

里不太严密）。

virtual double calculate_rho();

计算

值。见3.7[1]节，The calculation of b or

Σ0 C yi 1.f (α)i

ΣαC, yi=<<

=<<

α1

ρ=

上海交通大学模式分析与机器智能实验室

void Solve(int l, const Kernel& Q, const double *b_, const schar *y_,

double *alpha_, double Cp, double Cn, double eps,

SolutionInfo* si, int shrinking);

//程序较大，逐步分解

part 1

// initialize alpha_status

{

alpha_status = new char[l];

for(int i=0;i<>< p="">

update_alpha_status(i);

}

更新一下alpha 的状态

part 2

// initialize active set (for shrinking)

{

active_set = new int[l];

for(int i=0;i<>< p="">

active_set[i] = i;

active_size = l;

}

为缩减做准备，将来要做交换

part 3

// initialize gradient

{

G = new double[l];

G_bar = new double[l];

int i;

for(i=0;i<>< p="">

{

G[i] = b[i];

G_bar[i] = 0;

}

for(i=0;i<>< p="">

)

if(!is_lower_bound(i))

{

Qfloat *Q_i = Q.get_Q(i,l)

;

double alpha_i = alpha[i]

;

int j;

for(j=0;j<>< p="">

)

G[j] += alpha_i*Q_i[j];

if(is_upper_bound(i))

for(j=0;j<>< p="">

上海交通大学模式分析与机器智能实验室

G_bar[j] += get_C(i) * Q_i[j];

}

G_bar[j]的生成公式如下：（注意，其中不包含b[i] 的值）

G(.) =

C ΣQij ,i

1,...,l

j =C

因为第一次建立G(i),所以没有判断alpha 的状态。而是按公式，全部计算了一遍。

get_Q(i,l)返回的值是Qij 矩阵中的第i 列，而不是第i 行，这是需要注意的地方。

再往下是大循环：

如果有必要，先进行筛选，使部分数据不再参加运算；选择工作集；更新alpha_i, alpha_j, 其更新

new new old old

的思路是保证：αi yi +

j yj =αi yi +

j yj ;对于边界情况，有特殊处理，主要是考虑

0 ≤αi

≤

Ci 的要求。当某一alpha 小于0时，做适当调整,调整的结果是alpha_i, alpha_j 仍然在

0 ≤αi

≤

Ci 范围内，同时其和同原来一样。对于推导过程，可以参考Sequential Minimal

Optimization for SVM

part 4

更新G(i),根据αi ,

j 的变化更新；

// update G

double delta_alpha_i = alpha[i] -old_alpha_i;

double delta_alpha_j = alpha[j] -old_alpha_j;

for(int k=0;k<>< p="">

)

{

G[k] += Q_i[k]*delta_alpha_i + Q_j[k]*delta_alpha_j;

}

part 5

以下是更新alpha_status 和G ,ahpha 状态更新较简单，根据alpha 状态前后是否有变化，适

当更新，更新的内容参考公式G

C ΣQij ,i

1,...,l

j =C

// update alpha_status and G_bar

{

bool ui = is_upper_bound(i)

;

bool uj = is_upper_bound(j)

;

update_alpha_status(i)

;

上海交通大学模式分析与机器智能实验室

update_alpha_status(j)

;

int k;

if(ui != is_upper_bound(i))//更新alpha_i 的影

响

{

Q_i = Q.get_Q(i,l)

;

if(ui)

for(k=0;k<>< p="">

)

G_bar[k] -= C_i * Q_i[k]

;

else

for(k=0;k<>< p="">

)

G_bar[k] += C_i * Q_i[k]

;

}

if(uj != is_upper_bound(j)) //更新alpha_j 的影

响

{

Q_j = Q.get_Q(j,l)

;

if(uj)

for(k=0;k<>< p="">

)

G_bar[k] -= C_j * Q_j[k]

;

else

for(k=0;k<>< p="">

G_bar[k] += C_j * Q_j[k];

}

part 6

以下计算目标函数值，因为Gt

(Qα+

p)t ，而目标值为

TQα+

，故：

// calculate objective value

{

double v = 0;

int i;

for(i=0;i<>< p="">

v += alpha[i] * (G[i] + b[i]);

si->obj = v/2;

}

part 7

回送结果。

// put back the solution

{

for(int i=0;i<>< p="">

alpha_[active_set[i]] = alpha[i];

}

上海交通大学模式分析与机器智能实验室

2.3 类Solver_NU

class Solver_NU : public Solver

{

public:

Solver_NU() {}

void Solve(int l, const Kernel& Q, const double *b, const schar *y,

double *alpha, double Cp, double Cn, double eps,

SolutionInfo* si, int shrinking)

{

this->si = si;

Solver::Solve(l,Q,b,y,alpha,Cp,Cn,eps,si,shrinking)

;

}

private:

SolutionInfo *si;

int select_working_set(int &i, int &j);

double calculate_rho();

void do_shrinking();

};

其中函数void Solve()完全调用了Solve::Solve(),this->si = si;一句是因为C++内部变量访问的限制

而添加。

成员函数：

int select_working_set(int &i, int &j)

;

选择工作集，参考[1],[4],[5], 同时可以参考Solver::select_working_set

。

double calculate_rho();

计算

值，参考[1],[4],[5] （对应libsvm 论文[1] ，其实返回值是b,这可以从后面预测目标值

可以看出。与Solver::calculate_rho 相比，增加了另外一个返回值，r，该值才是真正的

值。

void do_shrinking()

;

对样本进行剪裁，参考[1],[4],[5] , 同时可以参考Solver::do_shrinking()

。

2.4 类SVC_Q

class SVC_Q: public Kernel

{

public:

SVC_Q(const svm_problem& prob, const svm_parameter& param, const schar *y_

)

:Kernel(prob.l, prob.x, param)

{

上海交通大学模式分析与机器智能实验室

clone(y,y_,prob.l)

;

cache = new Cache(prob.l,(int)(param.cache_size*(1<<20)))

;

}

Qfloat *get_Q(int i, int len) const

{

Qfloat *data;

int start;

if((start = cache->get_data(i,&data,len)) < len)

{

for(int j=start;j<>< p="">

data[j] = (Qfloat)(y[i]*y[j]*(this->*kernel_function)(i,j))

;

}

return data;

}

void swap_index(int i, int j) const

{

cache->swap_index(i,j)

;

Kernel::swap_index(i,j)

;

swap(y[i],y[j])

;

}

~SVC_Q()

{

delete[ ] y;

delete cache;

}

private:

schar *y;

Cache *cache;

};

说明：

SVC_Q(const svm_problem& prob, const svm_parameter& param, const schar *y_)

:Kernel(prob.l, prob.x, param)

该构造函数利用初始化列表Kernel(prob.l, prob.x, param)将样本数据和参数传入(非常简洁)。

get_Q(int i, int len)函数与其他同类相比，在于核函数不同。

swap_index(int i, int j) //交换的东西太多了点

2.5 类ONE_CLASS_Q

class ONE_CLASS_Q: public Kernel

{

上海交通大学模式分析与机器智能实验室

public:

ONE_CLASS_Q(const svm_problem& prob, const svm_parameter& param)

:Kernel(prob.l, prob.x, param)

{

cache = new Cache(prob.l,(int)(param.cache_size*(1<<20)))

;

}

Qfloat *get_Q(int i, int len) const

{

Qfloat *data;

int start;

if((start = cache->get_data(i,&data,len)) < len)

{

for(int j=start;j<>< p="">

data[j] = (Qfloat)(this->*kernel_function)(i,j)

;

}

return data;

}

void swap_index(int i, int j) const

{

cache->swap_index(i,j)

;

Kernel::swap_index(i,j)

;

}

~ONE_CLASS_Q()

{

delete cache;

}

private:

Cache *cache;

};

ONE_CLASS_Q 只处理1 类分类问题(?) ，故不保留y[i] 。编号只有1 类。

get_Q(int i, int len)函数中缺少了y[i],y[j] ，这与One_Class 本身特点有关，只处理一类。

swap_index(int i, int j)少swap(y[i],y[j]); 这句，因为根本没有y[i] 可供交换。

2.5 类SVR_Q

class SVR_Q: public Kernel

{

public:

SVR_Q(const svm_problem& prob, const svm_parameter& param)

:Kernel(prob.l, prob.x, param)

上海交通大学模式分析与机器智能实验室

{

//skipped

}

void swap_index(int i, int j) const

{

swap(sign[i],sign[j])

;

swap(index[i],index[j])

;

}

Qfloat *get_Q(int i, int len) const

{

//skipped

}

~SVR_Q(

)

{

//skipped

}

private:

int l;

Cache *cache;

schar *sign;

int *index;

mutable int next_buffer;

Qfloat* buffer[2];

};

本类主要是用于做回归，同分类有许多不同之处。参考[1],[5]

//以下的函数全为静态函数，只能在本文件范围内被访问。对照[1] 中公式查看。

2.6 函数solve_c_svc

static void solve_c_svc(const svm_problem *prob, const svm_parameter* param,

double *alpha, Solver::SolutionInfo* si, double Cp, double Cn)

在公式

TQα+

pTα

中，pT 为全-1,另外alpha[i]=0, 保证yT α=

0 的限制条件，在将来选

择工作集后更新alpha 时，仍能保证该限制条件。

2.7 函数solve_nu_svc

static void solve_nu_svc( const svm_problem *prob, const svm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

pT 为全0,alpha[i] 能保证eT α=

0, yTα=

2.8 函数solve_one_class

上海交通大学模式分析与机器智能实验室

static void solve_one_class(const svm_problem *prob, const svm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

限制条件eTα=

vl ，前vl 个alpha 为1，此后的alpha 全为0，初始条件满足限制条件eTα=

pT 为全0，y 为全1

2.9 函数solve_epsilon_svr

static void solve_epsilon_svr(const svm_problem *prob, const svm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

2.10 函数solve_nu_svr

static void solve_nu_svr( const svm_problem *prob, const svm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

第三节：接口函数、流程

decision_function svm_train_one(const svm_problem *prob, const svm_parameter *param,

double Cp, double Cn)

训练一组样本集，通常参加训练的样本集只有两类。

程序根据相应的参数，选择所使用的训练或者拟合算法。(这个地方的代码居然如此少)，最后统

计SV和BSV，最后输出决策函数。

void sigmoid_train( int l, const double *dec_values, const double *labels,

double& A, double& B)

LibSVM2.6 新增函数

根据预报值来确定A,B rij

≈

Af. +B

见第8 节[1], 其中A,B 的确定就由本函数确定。

double sigmoid_predict(double decision_value, double A, double B)

LibSVM2.6 新增函数

可以看看，里面的公式很简单。

void multiclass_probability(int k, double **r, double *p)

LibSVM2.6 新增函数

(好像比较复杂哦. )

void svm_binary_svc_probability(const svm_problem *prob, const svm_parameter *param,

double Cp, double Cn, double& probA, double& probB)

LibSVM2.6 新增函数

上海交通大学模式分析与机器智能实验室

先做交叉验证，然后用决策值来做概率估计。需要调用sigmoid_train 函数。

double svm_svr_probability( const svm_problem *prob, const svm_parameter *param)

LibSVM2.6 新增函数

先做交叉验证，然后函数经过计算后，输出概率值。

svm_model *svm_train(const svm_problem *prob, const svm_parameter *param)

根据选择的算法，来组织参加训练的分样本，以及进行训练结果的保存。其中会对样本进行初步

的统计。

一、分类部分：

→统计类别总数,同时记录类别的标号，统计每个类的样本数目

→将属于相同类的样本分组，连续存放

→计算权重C

→训练n(n-1)/2个模型

→初始化nozero数组，便于统计SV

→//初始化概率数组

→训练过程中，需要重建子数据集，样本的特征不变，但样本的类别要改为+1/-1

→//如果有必要，先调用svm_binary_svc_probability

→训练子数据集svm_train_one

→统计一下nozero,如果nozero已经是真，就不变，如果为假，则改为真

→输出模型

→主要是填充svm_model,

→清除内存

二、回归部分：

→类别数固定为2

→//选择性地做svm_svr_probability, one-class不做概率估计

→训练

→输出模型

→清除内存

训练过程函数调用：

svm_train→svm_train_one→solve_c_svc(fox example)→

→Solver s;//这里调用构造函数，但啥也没有做。

→s.Solve(l, SVC_Q(*prob,*param,y), minus_ones, y, alpha, Cp, Cn, param->eps, si,

param->shrinking);

→调用SVC_Q(Kernel) 类的构造函数，同时也会调用Kernel类的构造函数。在SVC_Q

类的构造函数中复制目标值(y), 同时申请内存，此时激发Cache类,申请内存，构造双向列表等。

→Solve函数做完其他部分工作，主要是算法的实现。

void svm_cross_validation(const svm_problem *prob, const svm_parameter *param, int nr_fold,

double *target)

LibSVM2.6 新增函数,LibSVM2.5中为示例函数。

上海交通大学模式分析与机器智能实验室

先随机打乱次序，然后根据n折的数目，留一份作为测试集，其他的作为训练集，做n次。

随机打乱次序使用的非标准的扑克洗牌的算法。(LibSVM2.5 里面随机排序的结果很乱)

For example:

样本集被分为10份；第一次，将样本集的第2～10部分作为整体进行训练，得到一个模型，然后

对样本集的第1部分进行预报，得到一个精度；第二次，将样本集的第1，3～10作为整体训练，

对第二部分进行预报，得到又一个精度，…。最后对10个精度做一下处理（方法很多，不逐一列

出）。

int svm_get_nr_class(const svm_model *model)

获得样本类别数；本函数为典型的马后炮。

void svm_get_labels(const svm_model *model, int* label)

某类样本的标号（样本并不按编号排列，通过标号，可以循序访问样本集）。

double svm_get_svr_probability(const svm_model *model)

访问训练好的模型中的概率值。

void svm_predict_values(const svm_model *model, const svm_node *x, double* dec_values)

预测样本数据目标值；

如果是做分类问题，返回一大堆值，供后续的函数做决策；如果是回归问题，返回一个值。

其中one-v-one 方法需要做n(n-1)/2 次，产生n(n-1)/2 个预报值。

double svm_predict(const svm_model *model, const svm_node *x)

预测，分类问题主要使用了One-to-One方法组织n*(n-1)/2 种方法。

如果是分类问题，对预测的n*(n-1)/2 个值，做投票处理，票数最高的是预报的类。

如果是One-Class,根据预报值的符号，返回+1/-1

如果是回归问题，直接返回该double 类型的值。

double svm_predict_probability(

const svm_model *model, const svm_node *x, double *prob_estimates)

LibSVM2.6 新增函数

跳过。

int svm_save_model(const char *model_file_name, const svm_model *model)

svm_model *svm_load_model(const char *model_file_name)

void svm_destroy_model(svm_model* model)

以上3 个函数均为LibSVM2.5 示例程序中的函数，现成为LibSVM2.6 的一部分

。

看看名字就知道是干什么的了，不介绍了

。

void svm_destroy_param(svm_parameter* param)

LibSVM2.6 新增函

数

释放权重系数数组的内存。

//检查数据

上海交通大学模式分析与机器智能实验室

const char *svm_check_parameter(const struct svm_problem *prob, const struct svm_parameter

*param);

该段代码检查参数的合理性。凡对LibSVM 进行增加SVC 类型和核函数，都必须修改该文件。

LibSVM2.5 在该部分代码会存在内存泄漏，LibSVM2.6 中已经修正。

其中需要注意的是，nu 的取值的范围，

nMin

nMax

nMin

其中nMax 为样本数最多的类的样本数，nMin 为样本数最少的类的样本。

int svm_check_probability_model(const svm_model *model)

LibSVM2.6 新增函数

检查概率模型，主要是检查一些限制条件。

Margin

Figure 1: SVM separation of two data classes - SV points circled.

Class 1

f3(x)

f1(x)

Class 2

Class 3

f2(x)

Figure 2: One-against-rest SVM separation of three data classes

上海交通大学模式分析与机器智能实验室

f1,2(x)

Class 1

f2,3(x)

f1,3(x)

Class 2

Class 3

Figure 3: One-against-one SVM separation of three data classes

43 21

Figure 4: Decision DAG SVM

其他

：

一、One-v-Rest 多类方

法

http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/1vsall/

二、DDAG 多类方

法

http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/libsvm-2.3dag.zip

1V4

2V4 1V3

2V3 1V2 3V4

Not 1 Not 4

Not 4

Not 1

Not 3

Not 2

上海交通大学模式分析与机器智能实验室

html里面的注释代码是什么？帮忙注释一下代码注释下列代码(详细) 注释这代码请教以下action script这段代码的注释请给下面的JAVA代码，每行注释，急急急急谁知道有里知花的I cry 歌词的中文注释谁有粤语的中文注释(歌词更好) 哪位大哥有带中文注释的emule源代码？我下载的电影，怎么没有中文注释？一篇英文想念男友的文章（加中文注释）有没有世界地图拼图游戏,我想要有中文注释的那种. 代码注释...求高人...谢谢. 请问在asp代码中.设置图片注释的时间代码是如何的? vb代码的意思．请在代码后面写上注释百度空间里面的注释代码是什么?空间里面的CSS代码太乱,想加一个注释,以后好辨认. 用c怎样计算代码行数（不算注释注释）求判断IE的cookies功能是否打开的ASP代码，有注释的最好！谁可以帮我找一下linux 2.4版本的内核代码有注释的求一个用VB做的分解因式的程序或代码。（最好有注释）高手给我传个JAVA编写的系统,代码要注释过的 [c]这段代码中注释的部分哪儿有问题谁给讲一下这个简单的asp代码，循环嵌套，要标准详细注释 QQ空间代码中的注释怎么写？

上天台 百度云:libsvm 2.6 的代码中文注释

上天台百度云:libsvm 2.6 的代码中文注释