机器学习笔记 - 性能度量_类别的真实标记与预测_volvet的博客-程序员秘密

技术标签: 机器学习  

在预测任务中, 给定样本集 D={ (x1,y1),(x2,y2),...,(xm,ym)} , 其中 yi 是样本 xi 的真实标记, 要评估学习器的性能, 就要把学习预测结果 f(x) 跟真实的标记进行比较。
回归任务常用均方误差(mean squared error)

E(f;D)=1mi=1m(f(xi)yi)2

更一般的, 对于数据分布 D 和其概率密度函数 p(.) , 均方误差可描述为
E(f:D)=xD(f(x)y)2p(x)dx

错误率与精度

给定样本集 D , 分类错误率定义为

E(f;D)=1mi=1m(f(xi)yi)

精度定义为

acc(f;D)=1mi=1m(f(xi)==yi)

更一般的, 对于数据分布 D 和其概率密度函数 p(.) , 错误率和精度定义为
E(f;D)=xD(f(x)y)p(x)dx

acc(f;D)=xD(f(x)==y)p(x)dx=1E(f;D)

混淆矩阵(Confusion Matrix)

对于二分类问题, 可以将其真实类别和预测类别的组合划分为TP(true positive), FP(false positive), TN(true negative), FN(false negative)四种, 显然 TP + FP + TN + FN = 样本总数。
分类结果的混淆矩阵如下所示

真实情况 预测结果
正例 正例(TP)
正例 反例(TN)
反例 正例(FP)
反例 反例(FN)

查准率 P 与查全率 R

P=TPTP+FP

R=TPTP+TF

 P-R曲线, ROC 与 AUC

P-R 曲线是以P为纵轴, R为横轴作图得到的曲线.
平衡点(Break-Even Point) 是 P == R 时候的取值.
True Positive Rate(TPR)
False Positive Rate(FPR)

TPR=TPTP+FN

FPR=FPTN+FP

ROC曲线就是以TPR为纵轴, FPR为横轴的曲线
AUC(Area Under ROC Curve)

Reference

  • 机器学习 - 周志华 清华大学出版社
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/volvet/article/details/54896830

智能推荐

网络游戏探索(ing_huangbaif的博客-程序员秘密

简述框架:unity(URP + xlua + VMUI)网络层使用udp,客户端使用xlua集成的luasocket,服务端使用c++源码服务端代码:#include <Winsock2.h>#include <cstdio>#include <string.h>#include <stdio.h>#include<map>#include <iostream>using namespace std;#

Windows- 每隔1s执行一段程序的方法_cmd中每隔一秒执行一个命令_bailang_zhizun的博客-程序员秘密

#include<windows.h>.....while(1){Sleep(1000);//延时1s.......}另外Sleep(1000):占用CPU,线程休眠1000ms;系统的CPU部分资源被占用,其他线程无法进入,增加时间限制Wait(1000):不占用CPU,线程等待1000ms;等待使用CPU,不占用系统CPU资源,会增加时间限...

科研画图工具_月亮不知道的博客-程序员秘密

http://alexlenail.me/NN-SVG/LeNet.htmlhttps://cbovar.github.io/ConvNetDraw/

oracle如何修改schema,oracle修改用户的schema_weixin_39945475的博客-程序员秘密

标签:aftersessionimmcreatmediaracoraclelogocreate临时:alter session set current_schema=X;永久:alter session set current_schema= X 倒是能解决问题,但这总不是个永久的解决方案;在after log on事件上做触发器执行上面的语句;cr...

计算机无法安装网卡驱动,网卡驱动安装不了,详细教您解决网卡驱动安装不了..._可可子姐姐教英语的博客-程序员秘密

重装系统后一般会没有网络,无法联网也是纯属正常现象,这时候,我们需要操作的更新网卡驱动软件了。这时候就只能从能上网的电脑下载下相应的网卡驱动,然而在安装的操作上,有用户却发现网卡驱动安装不了。这该怎么办呢?具体的操作流程,下面,小编给大家整理了解决网卡驱动安装不了的操作教程。随着网络科技的发展,越来越多的用户都开始上网。无论是在生活上,还是工作上,就连大学上的学生也离不开电脑网络,既然给我们带来方...

【数理知识】《矩阵论》方保镕老师-第8章-矩阵在数学内外的应用_矩阵论 方保镕csdn_Zhao-Jichao的博客-程序员秘密

第8章-矩阵在数学内外的应用8.1 矩阵在数学内部的应用8.1.1 矩阵在代数中的应用8.1.2 矩阵在几何中的应用8.1.3 矩阵在图论中的应用1. 邻接矩阵的概念2. 无向图的邻接矩阵3. 有向图的邻接矩阵4. 图论中重要定理的证明定理 8.1.5定理 8.1.6 (友谊定理)8.2 矩阵在数学之外的应用8.2.1 矩阵在信息编码中的应用8.2.2 矩阵在经济模型中的应用8.2.3 矩阵在生物种群生长繁殖问题中的研究8.2.4 矩阵在控制论中的应用1. 系统的可观测性2. 系统的能控性3. 系统的可稳定

随便推点

googletest简介_google test_唏噗的博客-程序员秘密

googletest是由谷歌的测试技术团队开发的测试框架,使用c++实现,具有跨平台等特性。好的测试框架引用谷歌给出的文档,好的测试应当具备以下特征:测试应该是独立的和可重复的。调试一个由于其他测试而成功或失败的测试是一件痛苦的事情。googletest通过在不同的对象上运行测试来隔离测试。当测试失败时,googletest允许您单独运行它以快速调试。测试应该很好地“组织”,并反映出测试代码的结构。googletest将相关测试分组到可以共享数据和子例程的测试套件中。这种通用模式很容易识别,并使测

【Unity笔记】使用unity UI 实现一个前端登录界面_Call me 兽医的博客-程序员秘密

首先,在canvas中创建2个input field ,再创建一个Button然后,简单修改内容如下创建一个脚本来相应按钮的点击事件在这里,我们创建一个叫MyGame的脚本,写一个Login方法public void Login() { Debug.Log("登录成功"); }注意,这个方法必须是 Public 的,否则挂载不到按钮上然后回到 Unity ,选择按钮,在OnClick 的list上点击加号,进行方法挂载首先,点击 +..

VC----MFC对话框练习-随机数生成工具_mfc生成随机数_猪猪侠吃面包的博客-程序员秘密

看了几天的MFC对话框,今天来自己试着写个关于生成随机数的对话框小程序吧,如果想自己制作一个简单的随机数程序,需要考虑哪些元素呢?1. 首先是如何生成随机数,这里我们使用rand()函数来实现,原型很简单,int rand()会返回一个RAND_MAX即32767范围内的一个随机数;2. 设计一个图形接口,自己决定使用一个对话框程序来写;3. 编写事件响应过程,重点是如何进行控件与过程

Spark Core的Driver上的Task的生成、分配、调度_spark driver core_香山上的麻雀1008的博客-程序员秘密

1. 什么是Task?在前面的章节里描述过几个角色,Driver(Client),Master,Worker(Executor),Driver会提交Application到Master进行Worker上的Executor上的调度,显然这些都不是Task.Spark上的几个关系可以这样理解:Application: Application是Driver在构建SparkContent的上下文的时候创建...

Dart基础-泛型和库_dart泛型数组和泛型集合_何小有的博客-程序员秘密

泛型如果你看过API文档的基本类型数组和列表,你会发现实际上所有都是泛型,使用泛型可以提高代码的可读性var names = new List<String>();names.addAll(['Seth', 'Kathy', 'Lars']);//不是字符串,编译失败names.add(42);使用泛型的另一个原因是减少代码重复,泛型可以创建多类型共享的接口,同时还能在检查模式早期预警,假如您

[YTU]_2638(编程题:多态--动物叫)_小天位的博客-程序员秘密

题目描述/*利用抽象基类来完成派生类dog和cat的定义,并利用指向基类的指针实现动态多态,输出不同类型动物的不同叫声。请在下面的程序段基础上完成设计,只提交begin到end部分的代码*/#include using namespace std; class animal   //抽象基类---动物类{public:virtual void

推荐文章

热门文章

相关标签