300字范文 > 构造matlab决策树分类器 Matlab建立逻辑回归决策树 SVM KNN和朴素贝叶斯模型分类

构造matlab决策树分类器 Matlab建立逻辑回归决策树 SVM KNN和朴素贝叶斯模型分类

时间：2019-07-13 20:26:03

尽管对于较高的阈值，SVM可以产生更好的ROC值，但逻辑回归通常更擅长区分不良雷达收益与良好雷达。朴素贝叶斯的ROC曲线通常低于其他两个ROC曲线，这表明样本内性能比其他两个分类器方法差。

比较所有三个分类器的曲线下面积。

AUClog

AUClog=0.9659

AUCsvm

AUCsvm=0.9489

AUCnb

AUCnb=0.9393

Logistic回归的AUC度量最高，而朴素的贝叶斯则最低。该结果表明，逻辑回归对此样本数据具有更好的样本内平均性能。

确定自定义内核功能的参数值

本示例说明如何使用ROC曲线为分类器中的自定义内核函数确定更好的参数值。

在单位圆内生成随机的一组点。

定义预测变量。将第一象限和第三象限中的点标记为属于正类别，而将第二象限和第二象限中的点标记为负类。

pred=[X1;X2];

resp=ones(4*n,1);

resp(2*n+1:end)=-1;%Labels

创建函数mysigmoid.m，该函数接受要素空间中的两个矩阵作为输入，并使用S形内核将其转换为Gram矩阵。

使用Sigmoid内核函数训练SVM分类器。使用标准化数据。

设置 gamma = 0.5，使用调整后的S形核训练SVM分类器。

SVMModel2=fitPosterior(SVMModel2);

[~,scores2]=resubPredict(SVMModel2);

计算两个模型的ROC曲线和曲线下面积(AUC)。

绘制ROC曲线。

plot(x1,y1)

holdon

plot(x2,y2)

holdoff

title('ROC for classification by SVM');

将gamma参数设置为0.5的内核函数可提供更好的样本内结果。

比较AUC度量。

auc1

auc2

auc1=

0.9518

auc2=

0.9985

伽玛设置为0.5时曲线下的面积大于伽玛设置为1时曲线下的面积。这也证实了伽玛参数值为0.5会产生更好的结果。为了直观比较这两个伽玛参数值的分类性能。

绘制分类树的ROC曲线

加载样本数据。

loadfisheriris

列向量 species由三种不同物种的鸢尾花组成。双矩阵 meas包含对花朵的四种测量类型：萼片长度，萼片宽度，花瓣长度和花瓣宽度。所有度量单位均为厘米。

使用萼片的长度和宽度作为预测变量训练分类树。

根据树预测物种的分类标签和分数。

[~,score]=resubPredict(Model);

分数是观察值(数据矩阵中的一行)所属类别的后验概率。列 score对应于所指定的类 'ClassNames'。

由于这是一个多类问题，因此不能仅将其 score(:,2)作为输入。这样做将无法提供 perfcurve有关两个阴性类别(setosa和virginica)分数的足够信息。此问题与二元分类问题不同，在二元分类问题中，知道一个类别的分数就足以确定另一个类别的分数。因此，必须提供 perfcurve将两个否定类的得分纳入考虑范围的函数。一种函数是score(：，2)-max(score(：，1)，score(：，3))。

X，默认为假阳性率，Y，默认为真阳性率(召回率或敏感性)。正类标签为 versicolor。由于未定义否定类别，因此 perfcurve假设不属于肯定类别的观测值属于一个类别。该函数将其接受为否定类。