技术标签: 夏令营 统计学 科研之路:Mobile+AI+game theory 概率论
互斥事件 \color{red}\textbf{互斥事件} 互斥事件
事件A和B的交集为空,A与B就是互斥事件,也叫互不相容事件。也可叙述为:不可能同时发生的事件。如A∩B为不可能事件(A∩B=Φ),那么称事件A与事件B互斥,其含义是:事件A与事件B在任何一次试验中不会同时发生。
则P(A+B)=P(A)+P(B)(这个公式何时成立在我一面thu叉院的时候被问到过,我神tm就答了一个相互独立/(ㄒoㄒ)/~~)且P(A)+P(B)≤1
对立事件 \color{red}\textbf{对立事件} 对立事件
若A交B为不可能事件,A并B为必然事件,那么称A事件与事件B互为对立事件,其含义是:事件A和事件B必有一个且仅有一个发生。
对立事件概率之间的关系:P(A)+P(B)=1。例如,在掷骰子试验中,A={出现的点数为偶数},b={出现的点数为奇数},A∩B为不可能事件,A∪B为必然事件,所以A与B互为对立事件。
互斥事件与对立事件两者的联系在于:对立事件属于一种特殊的互斥事件。
它们的区别可以通过定义看出来:一个事件本身与其对立事件的并集等于总的样本空间;而若两个事件互为互斥事件,表明一者发生则另一者必然不发生,但不强调它们的并集是整个样本空间。即对立必然互斥,互斥不一定会对立。
独立事件 \color{red}\textbf{独立事件} 独立事件
设A,B是试验E的两个事件,若 P ( A ) > 0 P(A)>0 P(A)>0,可以定义 P ( B ∣ A ) P(B∣A) P(B∣A).一般A的发生对B发生的概率是有影响的,所以条件概率 P ( B ∣ A ) ≠ P ( B ) P(B∣A)≠P(B) P(B∣A)=P(B),而只有当A的发生对B发生的概率没有影响的时候(即A与B相互独立)才有条件概率 P ( B ∣ A ) = P ( B ) P(B∣A)=P(B) P(B∣A)=P(B).这时,由乘法定理 P ( A ∩ B ) = P ( B ∣ A ) P ( A ) = P ( A ) P ( B ) . P(A∩B)=P(B∣A)P(A)=P(A)P(B). P(A∩B)=P(B∣A)P(A)=P(A)P(B).
定义:设A,B是两事件,如果满足等式 P ( A ∩ B ) = P ( A B ) = P ( A ) P ( B ) P(A∩B)=P(AB)=P(A)P(B) P(A∩B)=P(AB)=P(A)P(B),则称事件A,B相互独立,简称A,B独立.
容易推广:设A,B,C是三个事件,如果满足 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B), P ( B C ) = P ( B ) P ( C ) P(BC)=P(B)P(C) P(BC)=P(B)P(C), P ( A C ) = P ( A ) P ( C ) P(AC)=P(A)P(C) P(AC)=P(A)P(C), P ( A B C ) = P ( A ) P ( B ) P ( C ) P(ABC)=P(A)P(B)P(C) P(ABC)=P(A)P(B)P(C),则称事件A,B,C相互独立
更一般的定义是, A 1 , A 2 , … … , A n A1,A2,……,An A1,A2,……,An是 n ( n ≥ 2 ) n(n≥2) n(n≥2)个事件,如果对于其中任意2个,任意3个,…任意n个事件的积事件的概率,都等于各个事件概率之积,则称事件 A 1 , A 2 , … , A n A1,A2,…,An A1,A2,…,An相互独立
概率公理与条件概率 \color{red}\textbf{概率公理与条件概率} 概率公理与条件概率
什么是概率?设实验E的样本空间为 Ω \Omega Ω,则称实值函数 P P P为概率,如果 P P P满足下列三个条件
什么是条件概率?设 A , B A,B A,B为两个事件,且 P ( A ) > 0 P(A)>0 P(A)>0,称
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB)
为在事件A发生的条件下事件B发生的条件概率。
五大概率公式 \color{red}\textbf{五大概率公式} 五大概率公式
古典型-能通过样本点数出来的概率 \color{red}\textbf{古典型-能通过样本点数出来的概率} 古典型-能通过样本点数出来的概率
几何型:通过几何度量计算的概率 \color{red}\textbf{几何型:通过几何度量计算的概率} 几何型:通过几何度量计算的概率
伯努利试验:独立重复实验 \color{red}\textbf{伯努利试验:独立重复实验} 伯努利试验:独立重复实验
伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生。我们假设该项试验独立重复地进行了n次,那么就称这一系列重复独立的随机试验为n重伯努利试验,或称为伯努利概型。单个伯努利试验是没有多大意义的,然而,当我们反复进行伯努利试验,去观察这些试验有多少是成功的,多少是失败的,事情就变得有意义了,这些累计记录包含了很多潜在的非常有用的信息。
随机变量 \color{red}\textbf{随机变量} 随机变量
在样本空间 Ω \Omega Ω上的实值函数 X = X ( ω ) , ω ∈ Ω X=X(\omega),\omega\in\Omega X=X(ω),ω∈Ω称为随机变量,简记为 X X X。随机变量不是一个变量,而是实值函数。
分布函数 \color{red}\textbf{分布函数} 分布函数
分布函数(英文Cumulative Distribution Function, 简称CDF),是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。
分布函数 F ( x ) F(x) F(x)是定义在 ( − ∞ , ∞ ) (-\infty,\infty) (−∞,∞)上的一个实值函数, F ( x ) F(x) F(x)的值等于随机变量 X X X在区间 ( − ∞ , x ] (-\infty,x] (−∞,x]上取值的概率,即事件 X ≤ x X\leq x X≤x的概率:
F ( x ) = P ( X ≤ x ) , x ∈ ( − ∞ , ∞ ) \color{blue}F(x)=P(X\leq x),x\in (-\infty,\infty) F(x)=P(X≤x),x∈(−∞,∞)
分布函数的性质主要有三条,单调不减,负无穷收敛到0 lim x → + ∞ F ( x ) = 1 \lim_{x\rightarrow+\infty} F(x)=1 limx→+∞F(x)=1,正无穷收敛到1。右连续性 F ( x + 0 ) = F ( x ) F(x+0)=F(x) F(x+0)=F(x).
这三个条件同样是 F ( x ) F(x) F(x)成为某一随机变量的分布函数的充分必要条件。
分布函数的定义对于离散型随机变量和连续型随机变量都是一致的,但是对于连续型随机变量而言,他还有概率密度
把随机变量的概率分布表推广到无限情况,就可以得到连续型随机变量的概率密度函数。 此时,随机变量取每个具体的值的概率为0,但在落在每一点处的概率是有相对大小的,描述这个概念的,就是概率密度函数。 你可以把这个想象成一个实心物体,在每一点处质量为0,但是有密度,即有相对质量大小,他有以下两条主要的性质。
伯努利分布(0-1分布) \color{red}\textbf{伯努利分布(0-1分布)} 伯努利分布(0-1分布)
0 — 1 0—1 0—1分布就是 n = 1 n=1 n=1情况下的二项分布。即只先进行一次事件试验,该事件发生的概率为 p p p,不发生的概率为 1 − p 1-p 1−p。这是一个最简单的分布,任何一个只有两种结果的随机现象都服从 0 − 1 0-1 0−1分布。
二项分布 \color{red}\textbf{二项分布} 二项分布
一般地,如果随机变量 X X X有分布律
则称 X X X服从参数为 n n n和 p p p的二项分布,我们记为 X ∼ B ( n , p ) X\thicksim B(n,p) X∼B(n,p)或 X ∼ b ( n , p ) X\thicksim b(n,p) X∼b(n,p)。
含义:在 n n n次独立重复的伯努利试验中,若每次实验的成功率为 p p p,则在 n n n次独立重复实验种成功的总次数 X X X服从二项分布。当 n = 1 n=1 n=1时,二项分布退化为 0 − 1 0-1 0−1分布。
几何分布 \color{red}\textbf{几何分布} 几何分布
如果随机变量 X X X的分布律为:
则称 X X X服从参数为 p p p的几何分布。
含义:在 n n n次伯努利试验中,试验 k k k次才得到第一次成功的机率服从几何分布
超几何分布 \color{red}\textbf{超几何分布} 超几何分布
如果随机变量 X X X的分布律为:
则称 X X X服从参数为 n , N , M n,N,M n,N,M的超几何分布。
含义:如果 N N N件产品中含有 M M M件次品,从中任意一次取出 n n n件(不放回依次取出 n n n件),另 X X X=抽取的 n n n件产品中的次品件数,则 X X X服从参数为 n , N , M n,N,M n,N,M的超几何分布。
如果有放回的取 n n n次,那么服从 B ( N , M N ) B(N,\frac{M}{N}) B(N,NM)。
泊松分布 \color{red}\textbf{泊松分布} 泊松分布
如果随机变量 X X X的分布律为:
则称 X X X服从参数为 λ \lambda λ的泊松分布,记为 X ∼ P ( λ ) X\thicksim P(\lambda) X∼P(λ)。
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。 泊松分布适合于描述单位时间内随机事件发生的次数。
在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率 λ λ λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布 P ( λ ) P(λ) P(λ)。
指数分布 \color{red}\textbf{指数分布} 指数分布
连续型均匀分布:如果连续型随机变量 X X X具有如下的概率密度函数,
则称 X X X服从 [ a , b ] [a,b] [a,b]上的均匀分布(uniform distribution),记为 X ∼ U ( a , b ) X\thicksim U(a,b) X∼U(a,b)。
正态分布 \color{red}\textbf{正态分布} 正态分布
如果随机变量 X X X的概率密度为:
其中 μ , σ \mu,\sigma μ,σ为常数而且 σ > 0 \sigma>0 σ>0,则称 X X X服从参数为 μ , σ \mu,\sigma μ,σ的正态分布,记作 X ∼ N ( μ , σ 2 ) X\thicksim N(\mu,\sigma^2) X∼N(μ,σ2)。当 μ = 0 , σ 2 = 1 \mu=0,\sigma^2=1 μ=0,σ2=1时,称 X X X服从标准正态分布。
二维随机变量 \color{red}\textbf{二维随机变量} 二维随机变量
设 X = X ( = ω ) X=X(=\omega) X=X(=ω), Y = Y ( ω ) Y=Y(\omega) Y=Y(ω)是定义在样本空间 Ω \Omega Ω上的两个随机变量,则称向量 ( X , Y ) (X,Y) (X,Y)为二维随机变量或者随机向量。
二维随机变量的分布 \color{red}\textbf{二维随机变量的分布} 二维随机变量的分布
F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X\leq x,Y\leq y) F(x,y)=P(X≤x,Y≤y),该分布具有如下的性质
边缘分布与二维随机变量分布函数的关系为:
F X ( x ) = P ( X ≤ x ) = P ( X ≤ x , Y < + ∞ ) = F ( x , + ∞ ) F_X(x)=P(X\leq x)=P(X\leq x,Y<+\infty)=F(x,+\infty) FX(x)=P(X≤x)=P(X≤x,Y<+∞)=F(x,+∞)
二维连续型随机变量的概率密度 \color{red}\textbf{二维连续型随机变量的概率密度} 二维连续型随机变量的概率密度
如果对于任意 x , y x,y x,y,都有
P ( X ≤ x , Y ≤ y ) = P { X ≤ x } P { Y ≤ y } P(X\leq x,Y\leq y)=P\{X\leq x\}P\{Y\leq y\} P(X≤x,Y≤y)=P{
X≤x}P{
Y≤y}
即 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y),则称随机变量 X X X与 Y Y Y相互独立。
随机变量相互独立的充要条件 \color{red}\textbf{随机变量相互独立的充要条件} 随机变量相互独立的充要条件
当 X , Y X,Y X,Y为离散型随机变量时, Z Z Z的分布律与一维离散型类似。
当 X , Y X,Y X,Y为连续型随机变量时, F Z ( z ) F_Z(z) FZ(z)的求法,可以用公式
F Z ( z ) = P ( Z ≤ z ) = P { g ( X , Y ) ≤ z } = ∫ ∫ g ( X , Y ) ≤ z f ( x , y ) d x d y F_Z(z)=P(Z\leq z)=P\{g(X,Y)\leq z\}=\int\int_{g(X,Y)\leq z} f(x,y)dxdy FZ(z)=P(Z≤z)=P{ g(X,Y)≤z}=∫∫g(X,Y)≤zf(x,y)dxdy
数学期望 \textbf{数学期望} 数学期望
数学期望的性质 \textbf{数学期望的性质} 数学期望的性质
随机变量X的函数Y=g(X)的数学期望 \textbf{随机变量X的函数Y=g(X)的数学期望} 随机变量X的函数Y=g(X)的数学期望
建议看一篇好文:https://www.cnblogs.com/bigmonkey/p/11088669.html
随机变量(X,Y)的函数Z=g(X,Y)的数学期望 \textbf{随机变量(X,Y)的函数Z=g(X,Y)的数学期望} 随机变量(X,Y)的函数Z=g(X,Y)的数学期望
这里需要注意的是两个随机变量不相关,这是区别于独立,互斥的另一种关系,不相关的充要条件是两个随机变量的相关系数 ρ X Y = 0 \rho_{XY}=0 ρXY=0。如果两个变量独立,那么相关系数一定为0,但是相关系数为0是线性不相关,不能推出两变量相互独立。
这里主要是理解,我就不摆公式了,
在统计活动中,人们发现,在相同条件下大量重复进行一种随机实验时,一件事情发生的次数与实验次数的比值,即该事件发生的频率值会趋近于某一数值。重复次数多了,这个结论越来越明显。这个就是最早的大数定律。一般大数定律讨论的是n个随机变量平均值的稳定性。
而中心极限定理则是证明了在很一般的条件下,n个随即变量的和当n趋近于正无穷时的极限分布是正态分布。(对,就是它,跟我念,正态分布!O.O哎,哪里都有它,记住记住。)
一句话解释:大数定律讲的是样本均值收敛到总体均值,说白了就是期望,如图一样:
而中心极限定理告诉我们,当样本足够大时,样本均值的分布会慢慢变成正态分布,对,就是如图这个样子:
上面是区别,那么联系根据区别也能看出来,都总结的是在独立同分布条件下的随即变量平均值的表现。
我们假设有n个独立随机变量,令他们的和为:
S n = ∑ i = 1 n X i S_n=\sum_{i=1}^n X_i Sn=i=1∑nXi
那么大数定律(以一般的大数定律为例),它的公式为:
S n n − E ( X ) → 0 \frac{S_n}{n}-E(X)\rightarrow 0 nSn−E(X)→0
而中心极限定理的公式为:
n ( S n n − E ( X ) ) → N ( 0 , ∑ ) \sqrt{n}(\frac{S_n}{n}-E(X))\rightarrow N(0,\sum) n(nSn−E(X))→N(0,∑)
注意:上面两个公式,一个是值为0,一直均值为0的正太分布;而左边极为相似!但不一样的。第二个公式比第一个公式多了 n \sqrt n n,所以你就记住这条就不会混乱了,来,跟我念一遍:“差了个 n \sqrt n n!”
总体分布的参数在很多情况下是未知的,如均值 μ μ μ、方差 σ 2 \sigma^2 σ2、泊松分布的 λ λ λ、二项分布的比例 π π π,其它分布还会有更多的未知参数,需要通过样本进行相应的估计,这种估计值就是点估计。
点估计的评价:
无偏性:如果参数估计值的数学期望等于被估计的参数值 E ( θ ) ^ E(\theta\widehat) E(θ) ,则称此估计量为无偏估计。与此相反则称为有偏估计。
有效性:当一个参数有多个无偏估计时,估计方差越小则越有效。
相合性(一致性):如果随着样本量增大,参数的估计量趋于被估计的参数值。
矩估计,即矩估计法,也称“矩法估计”,就是利用样本矩来估计总体中相应的参数。首先推导涉及感兴趣的参数的总体矩(即所考虑的随机变量的幂的期望值)的方程。然后取出一个样本并从这个样本估计总体矩。接着使用样本矩取代(未知的)总体矩,解出感兴趣的参数。从而得到那些参数的估计。
矩法估计原理简单、使用方便,使用时可以不知总体的分布,而且具有一定的优良性质(如矩估计为Eξ的一致最小方差无偏估计)。矩法估计量实际上只集中了总体的部分信息,这样它在体现总体分布特征上往往性质较差,只有在样本容量n较大时,才能保障它的优良性,因而理论上讲,矩法估计是以大样本为应用对象的。
用样本矩作为相应的总体矩估计来求出估计量的方法.其思想是:如果总体中有 K K K个未知参数,可以用前 K K K阶样本矩估计相应的前 K K K阶总体矩,然后利用未知参数与总体矩的函数关系,求出参数的估计量。即有多少未知参数,就利用矩列几个方程。
令样本的 l l l阶原点矩为 A l = 1 n ∑ i = 1 n X i l A_l=\frac{1}{n}\sum_{i=1}^n X_i^l Al=n1∑i=1nXil,而每阶矩肯定也是 X X X分布中未知参数 θ 1 , θ 2 , . . . , θ n \theta_1,\theta_2,...,\theta_n θ1,θ2,...,θn的函数,即
α l ( θ 1 , θ 2 , . . . , θ n ) = A l , l = 1 , 2 , . . . , k \alpha_l(\theta_1,\theta_2,...,\theta_n)=A_l,l=1,2,...,k αl(θ1,θ2,...,θn)=Al,l=1,2,...,k
极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!
最大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
求最大似然函数估计值的一般步骤:
(1) 写出似然函数
(2) 对似然函数取对数,并整理
(3) 求导数
(4) 解似然方程
文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文
文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作 导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释: cwy_init/init_123..._达梦数据库导入导出
文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js
文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6
文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输
文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...
文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure
文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割
文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答
文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。
文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入
文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf