概率论与数理统计学习笔记(2)——联合概率、条件概率与边缘概率_联合条件概率图形表示-程序员宅基地

技术标签: 数学  概率论  

这篇文章主要是从一个直观的概念上讲解联合概率、条件概率与边缘概率。
主要是之前看了篇论文,用的SO-PMI算法,然后我就恶补了一下联合概率。
本篇博客采用的参考书是《程序员的数学2概率统计》。

这里先画一个程序员的数学上面的图,方便后续阐述,图没有书上那么好看,凑合一下:
概率图
红色部分代表住宅,白色部分代表工厂,蓝色部分代表农田。

左边是A县,中间是B县,右边是C县。

我发现国外的内容,关于概率这一块都是以面积等直观的东西来描述的,并非是纯粹的数字,我现在也在尝试从数字转换为面积这种思想转变,嗯,还是很难。

联合概率

联合概率,联合联合,指的就是几个东西联合起来的区域。联合概率一共有三种表达方式:

  1. P ( A B ) P(AB) P(AB)
  2. P ( A , B ) P(A,B) P(A,B)
  3. P ( A ∩ B ) P(A∩B) P(AB)

虽然市面上我看到的大多联合概率的表达都是第二种,但是其实第三种是我觉得最容易理解的东西,就是两个部分交起来。

比如上图,我们想知道A县住宅的面积,那么用联合概率表达为 P ( A , 住 宅 ) P(A, 住宅) P(A,),也就是第一根竖着的线的左边的红色区块的面积。

联合概率中,如果两个事件是相互独立的,那么会有个结论:
P ( A , B ) = P ( A ) P ( B ) P(A,B)=P(A)P(B) P(A,B)=P(A)P(B)
我对这个公式的理解为:由于AB独立,那么AB是互不影响的,那么我AB同时发生的概率,就等于说是A发生的概率与B发生的概率之乘。

这里用另外一个不是书上的栗子说明(因为书上栗子我没看懂),就我连续丢一枚硬币两次,那么第一次的结果肯定是不会影响到第二次的结果对吧,我们观察下表:
联合概率
假设我们要测第一次和第二次都为正面的概率,即 P ( 第 一 次 = 正 , 第 二 次 = 正 ) P(第一次=正,第二次=正) P(==),我们会很自然而然的用 P ( 第 一 次 = 正 ) ∗ P ( 第 二 次 = 正 ) = 1 4 P(第一次=正)*P(第二次=正)=\frac{1}{4} P(=)P(=)=41,为什么,就是我们知道这是独立的,互不干扰,所以就直接相乘。(当然我感觉这有点违背推理过程了,因为是先知道的结果,再反推的过程,但是最重要的是理解何为独立)

所以给大家提个醒,如果你去买彩票,就别每次心理安慰买同一个号了,反正中奖概率也不会提高,毕竟都是独立事件,对吧。

这里继续回到之前说的土地面积的栗子,我们会得到一个结论:
P ( 住 宅 ) = P ( A , 住 宅 ) + P ( B , 住 宅 ) + P ( C , 住 宅 ) P(住宅)=P(A,住宅)+P(B,住宅)+P(C,住宅) P()=P(A,)+P(B,)+P(C,)
P ( 工 厂 ) = P ( A , 工 厂 ) + P ( B , 工 厂 ) + P ( C , 工 厂 ) P(工厂)=P(A,工厂)+P(B,工厂)+P(C,工厂) P()=P(A,)+P(B,)+P(C,)
P ( 农 田 ) = P ( A , 农 田 ) + P ( B , 农 田 ) + P ( C , 农 田 ) P(农田)=P(A,农田)+P(B,农田)+P(C,农田) P()=P(A,)+P(B,)+P(C,)
P ( A ) = P ( A , 住 宅 ) + P ( A , 工 厂 ) + P ( A , 农 田 ) P(A)=P(A,住宅)+P(A,工厂)+P(A,农田) P(A)=P(A,)+P(A,)+P(A,)
P ( B ) = P ( B , 住 宅 ) + P ( B , 工 厂 ) + P ( B , 农 田 ) P(B)=P(B,住宅)+P(B,工厂)+P(B,农田) P(B)=P(B,)+P(B,)+P(B,)
P ( C ) = P ( C , 住 宅 ) + P ( C , 工 厂 ) + P ( C , 农 田 ) P(C)=P(C,住宅)+P(C,工厂)+P(C,农田) P(C)=P(C,)+P(C,)+P(C,)

上面三个公式,对应的就是从左向右看,下面三个公式,对应的就是从上往下看,那么这几个公式告诉了我们,当你确定某一个样本(比如县城或者用途)后,那么其余几项之和等于总的这一个样本的概率

用公式表达(假设是两个随机变量)就是:
P ( X = a ) = ∑ b P ( X = a , Y = b ) P(X=a)=\sum_bP(X=a,Y=b) P(X=a)=bP(X=a,Y=b)
P ( X = b ) = ∑ a P ( X = a , Y = b ) P(X=b)=\sum_aP(X=a,Y=b) P(X=b)=aP(X=a,Y=b)
书上对于 ∑ b ( ⋅ ⋅ ⋅ ) \sum_b(···) b()的解释是:穷举Y可取的值b后,由所有与这些值对应的(···)相加得到的和。

我个人觉得这个解释太繁琐了,用我个人的解释来说就是,我们把每个求和或者求积看作是一层循环,那么就是把a看作是常量(即固定X的值),循环每个Y(for y in Y),每轮都可以获得一个P(X, Y),把这些概率相加。

然后这个循环就可以引出我们下一个话题:边缘概率。

边缘概率

边缘概率指的就是,固定住某一个值,另外一个值变化的概率,即只关心一个变量的概率分布,而不再考虑另一个变量的影响。其实这也是个降维的过程,假设我们是两个随机变量,我们固定住某一个变量,那么是不是我们考虑的东西就是一维的东西了?

我用浙江大学《概率论与数理统计》第四版的例题一来给大家直观感受下边缘概率(主要是我抠脑壳想不出来)。题目如下:

一整数N等可能的在1,2,3,···,10十个数中取一个值,设D=D(N)是能整除N的正整数的个数,F=F(N)是能整除N的素数的个数(1不是素数),试写出D和F的联合分布率,并求边缘分布率。

样本空间,D以及F取值情况如下:
边缘概率
联合分布率与边缘分布率如下:
答案
最下面那一行和最右边这一列就是边缘概率,中间的那一坨坨就是联合概率。

条件概率

最后我们再来谈谈条件概率。

条件概率就是指在某个条件下,另外一个的概率,用公式表达为 P ( A ∣ B ) P(A|B) P(AB),即在B的情况下,A发生的概率。

就比如上面的面积图, P ( 工 厂 ∣ A ) P(工厂|A) P(A),代表的就是在A县的工厂的面积。

条件概率有个公式:
P ( 工 厂 ∣ A ) = P ( 工 厂 , A ) P ( A ) P(工厂|A)=\frac{P(工厂,A)}{P(A)} P(A)=P(A)P(A)

这个公式后半部分的意思就是,A中工厂占A的面积(概率)是多少,即A中工厂的面积。还没搞懂的同学,不妨想一想,我们求某个事件A在某个范围 ω \omega ω内发生的概率,我们是不是直接求 A ω \frac{A}{\omega} ωA,这里也是一样的,就是上面的联合概率,在某个范围内发生的概率。

那么我们来总结下,联合概率针对的是某几个条件在某个范围中发生的情况,条件概率是在某个条件成立的情况下的某个事件的概率。而从公式和上面的面积图来看,联合概率就是几个框框的交集部分,而条件概率就是这个框框的交集占某个部分的面积

那么如果是独立的情况,条件概率可以转换为如下的公式:
P ( A ∣ B ) = P ( A , B ) P ( B ) = P ( A ) P ( B ) P ( B ) = P ( A ) P(A|B)=\frac{P(A,B)}{P(B)}=\frac{P(A)P(B)}{P(B)}=P(A) P(AB)=P(B)P(A,B)=P(B)P(A)P(B)=P(A)

这个公式表达的意思也很直观,就是我们既然独立,那么我成立于否与你是否是我的条件有个毛的关系啊,即我就是我自己,用一个栗子说明这个问题(如有雷同,当我瞎BB):
P ( 我 耍 朋 友 ∣ 李 现 耍 朋 友 ) = P ( 我 耍 朋 友 ) P(我耍朋友|李现耍朋友)=P(我耍朋友) P()=P()
就是说,我耍朋友和李现耍朋友是独立的,那么李现耍朋友关我屁事啊,根本影响不到我。

参考

[1]平冈和幸,堀玄.程序员的数学2概率统计[M].人民邮电出版社:北京,2015-8:29-55.
[2]盛骤,谢式千,潘承毅.概率论与数理统计(第四版)[M].高等教育出版社:北京,2009-8:64-65.

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_35357274/article/details/108968557

智能推荐

2023基于微信小程序的房屋租赁管理系统(SSM+mysql)-JAVA.VUE毕业设计(论文+开题报告+运行)_微信小程序-房屋管理系统-程序员宅基地

文章浏览阅读982次。本系统后台采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。图4-1系统工作原理图。_微信小程序-房屋管理系统

Java串口通讯基础概念-程序员宅基地

文章浏览阅读83次。串行通讯协议有很多种,像RS232,RS485,RS422,甚至现今流行的USB等都是串行通讯协议。而串行通讯技术的应用无处不在。可能大家见的最多就是电脑的串口与Modem的通讯。记得在PC机刚开始在中国流行起来时(大约是在90年代前五年),那时甚至有人用一条串行线进行两台电脑之间的数据共享。除了这些,手机,PDA,USB鼠标、键盘等等都是以串行通讯的方式与电脑连接。而笔者工作性质的关系,..._peak 串口

MySql索引失效及解决方案_mysql or索引失效如何解决-程序员宅基地

文章浏览阅读1.2k次。MySql索引失效及解决方案_mysql or索引失效如何解决

Android安卓实战项目(12)—关于身体分析,BMI计算,喝水提醒,食物卡路里计算APP【支持中英文切换】生活助手类APP(源码在文末)-程序员宅基地

文章浏览阅读1.1k次。Android安卓实战项目(12)---关于身体分析,BMI计算,喝水提醒,食物卡路里计算APP【支持中英文切换】生活助手类APP(源码在文末)

对于人工智能的理解_你对人工智能目的的理解-程序员宅基地

文章浏览阅读2.7k次。分享一下这几天对人工智能的想法人工智能,缩写AI。谈到人工智能,我们首先想到的,它是一门学科,要我们去学习,但人工智能的终极目标是对人的意识、思维过程的模拟,它能像人那样思考,甚至超过人的智能。人工智能是一个交叉学科,涉及多领域,多专业,所以其复杂度可想而知。虽然,现在的人工智能还处于初级阶段,但是,不缺我们对之想象探索。它将是现在以及未来社会建设和发展的主流之一,将会影响我们未来生活各个方面发生重大改变。当然,我们现在的生活中在很多运用人工智能,如很多网站的AI客服,网上购平台为了提前预见客户的需求_你对人工智能目的的理解

HBase实践-程序员宅基地

文章浏览阅读2.5k次。HBase实践1.下载HBase查看版本号对应的java,Hadoophttps://hbase.apache.org/book.html#configuration下载地址:https://archive.apache.org/dist/hbase/stable/我下载的版本是stable版本:2.HBase2.4.10安装1.1 解压安装包hbase-2.2.2-bin.tar.gz至路径 /usr/local,命令如下:cd ~/Downloads/解压到/usr/loca

随便推点

html中的分离式布局,DIV+CSS技术在网页布局中的应用-程序员宅基地

文章浏览阅读814次。摘 要 信息科学技术的进步使得互联网技术行业快速发展起来。其中网页设计作为互联网技术行业中重要的一部分,应用先进技术提高其工作效率与工作质量具有重要意义。DIV+CSS技术在网页布局中的优势作用使得其在网页设计与开发中应用越来越广泛。基于此,本文首先对DIV+CSS技术进行概述,并对其在网页布局中的优势与应用原理进行分析,最后举出网页设计的实例对该项技术的具体应用进行分布阐述。【关键词】DIV C..._布局与样式分离

Spring源码分析——Bean的加载_在spring中bean的创建过程-程序员宅基地

文章浏览阅读240次。Spring版本:5.1.14.RELEASEBean实例创建过程如下图,Bean的创建过程大部分是在docreateBean()里面完成的。_在spring中bean的创建过程

RTT Studio和Cubemx联合开发_rtt cube-程序员宅基地

文章浏览阅读892次。1. RTT studio创建工程创建工程## 创建完成以后的目录结构2. 配置CubuMx双击cubumx的图标打开CubeMx配置时钟生成代码构建后的代码结构编译代码满屏错误:不要慌3. 新增脚本新建scons脚本文件 SConscript脚本内容如下import osfrom building import *cwd = GetCurrentDir()src = Glob('*.c')# add cubemx driverssrc = Split('''_rtt cube

java string 去掉某个字符_JAVA String 如何去掉指定字符-程序员宅基地

文章浏览阅读3.2w次,点赞4次,收藏10次。展开全部i、replace方法该方法的作用是替换字符串中所有指定的字e69da5e6ba9062616964757a686964616f31333337616637符,然后生成一个新的字符串。经过该方法调用以后,原来的字符串不发生改变。例如:Strings=“abcat”;Strings1=s.replace(‘a’,‘1’);该代码的作用是将字符串s中所有的字符a替换成字符1,生成的..._string去掉指定字符

java:手动实现一个IOC_java手写ioc-程序员宅基地

文章浏览阅读749次,点赞3次,收藏11次。面试官特别爱问SpringIOC底层实现,Spring源码晦涩难懂 怎么办呢? 跟着老师手动实现一个mini ioc容器吧,实现后再回头看Spring源码事半功倍哦~,就算直接和面试官讲也完全可以哦,类名完全按照源码设计,话不多说 开干~!手动实现IOC容器的设计需要实现的IOC功能:可以通过xml配置bean信息 可以通过容器getBean获取对象 能够根据Bean的依赖属性实现依赖注入 可以配置Bean的单例多例实现简易IOC设计的类类之间关系模型..._java手写ioc

【计算机网络】应用层详解_应用层解析-程序员宅基地

文章浏览阅读558次。1.协议1.1 应用层自定制协议HTTP协议1.2 传输层UDP协议TCP协议1.3 自定制协议自定制协议是应用层协议,被程序员定义出来的协议(应用层对要传输的数据,进行数据格式的约定,消息发送方和接收方都必须遵守约定)TCP特性:面向字节流 2.TCP粘包问题 我们需要在应用层自定制协议,自定制协议增加报头和分隔符【定长报头(数据长度)】+数据【定长报头】+ 数据+分隔符【不定长报头】+数据+分隔符 对于定长报头,双方的收发都是遵守约定的 不定长的_应用层解析

推荐文章

热门文章

相关标签