• ## 随机变量

千次阅读 2019-09-18 17:05:26
一、中心问题：将实验结果数量化 二、随机变量 ...2.1、常见的两类随机变量（离散型...2.1.1、离散型随机变量的定义： 若随机变量X的取值为有限个或可数 离散, 则称X为离散型随机变量。 2.2、0-1分布 ...
一、中心问题：将实验结果数量化 二、随机变量
注：随机变量虽然名为变量，实质是一个函数  随机变量既然是一个函数，必然具有函数的特征，不会出现一对多的情况。 2.1、常见的两类随机变量（离散型、连续型） 2.1.1、注意： 离散随机变量是取有限个或可数无限 展开全文 • 离散随机变量和连续随机变量 表中的内容 (Table of Content) Random Variables 随机变量 Probability Distribution Functions 概率分布函数 Well Known PMFs You Should Know 您应该知道的众所周知的PMF Well Known ...
离散随机变量和连续随机变量 表中的内容 (Table of Content)
Random Variables 随机变量 Probability Distribution Functions 概率分布函数 Well Known PMFs You Should Know 您应该知道的众所周知的PMF Well Known PDFs You Should Know 您应该知道的知名PDF Mean and Variance 均值和方差 Mean and Variance of Common Distributions 共同分布的均值和方差 Covariance and Correlation 协方差和相关  前言 (Preface)
Surprisingly, random variables are not really taught in online data science courses which is ludicrous because they’re the foundation of statistics which is the foundation of data science! 令人惊讶的是，在在线数据科学课程中并没有真正教授随机变量，这很可笑，因为它们是统计的基础，而统计是数据科学的基础！
Therefore, this aims to provide a comprehensive crash course on the basics of random variables. Let’s dive into it! 因此，这旨在提供一个基于随机变量的综合崩溃课程。 让我们开始吧！
随机变量 (Random Variables)
A random variable (RV), usually denoted X, is a variable whose possible values are numerical outcomes of a random phenomenon. In simpler terms, a random variable has a set of values and it can take on any one of those values at random. A random variable is a function from the sample space to real life. 通常表示为X的随机变量(RV)是其可能值为随机现象的数值结果的变量。 简单来说，随机变量具有一组值，并且可以随机采用这些值中的任何一个。 随机变量是从样本空间到现实生活的函数。
There are two types of random variables, discrete and continuous. 随机变量有两种类型，离散变量和连续变量。
离散随机变量 (Discrete Random Variables)
A discrete random variable is one in which the number of possible values is finite or countably infinite. 离散随机变量是其中可能值的数量是有限的或可计数的无限的变量 。
Examples of discrete RVs include the number of people that enter a grocery store on a given day, the number of children in a family, or the number of defective batteries in a box of 24. 离散RV的示例包括在特定日期进入杂货店的人数，一个家庭中的孩子人数或24盒装的有故障电池的数量。
连续随机变量 (Continuous Random Variables)
A continuous random variable is one in which the number of possible values is uncountably infinite. 连续随机变量是其中可能值的数量无穷无穷的变量 。
Examples of continuous RVs include the height and weight of a person. 连续RV的示例包括人的身高和体重。
概率分布函数 (Probability Distribution Functions)
For every random variable is an associated probability distribution function. A probability distribution function essentially gives the probabilities associated with obtaining each possible value or an interval of values. 对于每个随机变量，都有一个关联的概率分布函数。 概率分布函数本质上给出了与获得每个可能值或值间隔有关的概率。
There are three types of probability distribution functions: probability mass function (pmf), probability density function (pdf), and the cumulative distribution function (cdf). 概率分布函数有三种类型：概率质量函数(pmf)，概率密度函数(pdf)和累积分布函数(cdf)。
概率质量函数(pmf)→对于离散RV (Probability Mass Function (pmf) → for discrete RVs)
The probability mass function (pmf) is a probability distribution of a discrete random variable, which is a list of probabilities associated with each possible value. 概率质量函数(pmf)是离散随机变量的概率分布， 离散随机变量是与每个可能值相关的概率列表。
In more technical terms, if X is a discrete RV then its pmf is: 用更专业的术语来说，如果X是离散的RV，则其pmf为： Note: 0 ≤ f(x) ≤ 1 and ∑f(x) = 1 注意：0≤f (x) ≤1和∑ f(x) = 1
概率密度函数(pdf)→用于连续RV (Probability Density Function (pdf) → for continuous RVs)
The probability density function (pdf) is a function whose integral is calculated to find the probabilities associated with a continuous random variable. 概率密度函数(pdf)是一个函数，其积分经过计算以查找与连续随机变量关联的概率。
In more technical terms, if X is a continuous RV then f(x) is the pdf of X if it satisfies the following: 用更专业的术语来说，如果X是连续的RV，则满足以下条件的f(x)是X的pdf：
∫f(x)dx = 1 (the area under the curve is 1) ∫f (x)dx = 1(曲线下的面积为1) f(x) > 0 for all x (the curve has no negative values) 所有x的f(x) > 0(曲线没有负值) The probability of an individual point is equal to zero. Therefore, you have to find the probability of an interval by finding the definite integral: 单个点的概率等于零。 因此，您必须通过找到定积分来找到区间的概率： 累积分布函数(cdf) (Cumulative Distribution Function (cdf))
Cumulative Distribution Functions (cdfs) apply to both discrete and continuous functions. The cdf is the function that gives the probability that a random variable, X, is less than or equal to x, for every value x. 累积分布函数   (cdfs)适用于离散函数和连续函数。 cdf是给出每个值x随机变量X小于或等于x的概率的函数。
In more technical terms, for any RV X, the cdf is defined by: 用更专业的术语来说，对于任何RV X ，cdf定义为： For discrete RVs, you would simply sum up the probabilities of all values less than or equal to x. 对于离散的RV，您只需将所有小于或等于x的值的概率求和。
For continuous RVs you would simply find the definite integral of the RV from point 0 to x. 对于连续的RV，您只需找到RV从点0到x的定积分。
Here are some theorems that you should know for cdfs: 这是关于CDFS的一些定理：
F(-∞) = 0 F(-∞)= 0 F(x) is monotonically non-decreasing (can only increase or stay the same as x increases). F(x)是单调非递减的(只能增加或保持与x的增加相同)。 P(X>x) = 1 - F(x) P(X> x)= 1-F(x) P(a<X<b) = F(b) - F(a) P(a <X <b)= F(b)-F(a) f(x) = F’(x) → the derivative of the cdf gives you the pdf f(x)= F'(x)→cdf的导数为您提供pdf If this doesn’t make sense to you, don’t worry. Here’s an example… 如果这对您没有意义，请不要担心。 这是一个例子……
PMF和CDF的示例 (Example of PMF and CDF)
Suppose we flip two coins. Then let x = the number of heads that come up. 假设我们掷两个硬币。 然后让x =出现的头数。
There are only three possibilities: the number of heads = 0, 1, or 2. We can summarize the probabilities associated with each possible outcome as follows: 只有三种可能性：正数= 0、1或2。我们可以将与每种可能结果相关的概率总结如下： The PMF is simply represented by the Probability column, which shows the probability for each possible outcome. PMF仅由“概率”列表示，该列显示了每种可能结果的概率。
Similarly, the CDF is simply represented by the Cumulative Probability column which shows the probability of obtaining the possible value or less. 类似地，CDF仅由累积概率列表示，该列显示获得可能值或更低值的可能性。
您应该知道的众所周知的PMF (Well Known PMFs You Should Know)
离散均匀分布 (Discrete Uniform Distribution)
X has the discrete uniform distribution if its pmf is: 如果X的pmf为： X具有离散的均匀分布： Example: Tossing a die, x = 1,2,3,4,5,6. Therefore n = 6 and the pmf for all x is equal to 1/6. 示例：掷一个骰子， x = 1,2,3,4,5,6。 因此， n = 6，所有x的pmf等于1/6。
二项分布 (Binomial Distribution)
Let X denote the number of successes from n independent trials with the probability of success equal to p. Then X has the Binomial Distribution with parameters n and p. (Notation: X ∼ Bin(n, p)) 令X表示n次独立试验的成功次数，成功概率等于p 。 那么X具有参数n和p的二项分布。 (符号：X〜Bin(n，p))
If X has the Binomial distribution then the probability of k successes in n trials is given by the pmf: 如果X具有二项式分布，则pmf给出n次试验中k次成功的概率： 泊松分布 (Poisson Distribution)
X has the poison distribution with parameter λ if its pmf is as follows: 如果X的pmf如下，则X的毒物分布为参数λ： 您应该知道的知名PDF (Well Known PDFs You Should Know)
均匀分布 (Uniform Distribution)
X has the uniform distribution (Notation: X ~ Unif(a,b) if X is equally likely to be anywhere between a and b. Its pdf is: X具有均匀的分布(如果X同样有可能位于a和b之间的任意位置，则表示法为X〜Unif(a，b)。其pdf为： 指数分布 (Exponential Distribution)
X has the exponential distribution with parameter λ if it has the pdf: 如果具有pdf，则X具有参数为λ的指数分布： 期望值和方差 (Expected Value and Variance)
The expected value or mean is the average value and is a weighted average of all possible x’s with weights given by f(x). The expected value or mean if a RV is: 期望值或平均值是平均值，并且是所有可能x的加权平均值，其权重由f(x)给出。 RV的期望值或均值： for discrete RVs for continuous RVsVariance is a measure of spread or dispersion. The variance of X is: 方差是散布或散布的量度。 X的方差为： 共同分布的均值和方差 (Mean and Variance of Common Distributions)
X〜伯努利(p) (X~Bernoulli(p))
E[X] = p E [X] = p
Var(X) = pq Var(X)= pq
X〜泊松(λ) (X~Poisson(λ))
E[X] = λ E [X] =λ
Var(X) = λ Var(X)=λ
X〜均匀(a，b) (X~Uniform(a,b))
E[X] = (a+b)/2 E [X] =(a + b)/ 2
Var(X) = (a-b)²/12 Var(X)=(ab)²/ 12
X〜普通(µ，σ²) (X~Normal(µ, σ²))
E[X] = µ E [X] = µ
Var(X) = σ² Var(X)=σ²
X〜指数(λ) (X~Exponential(λ))
E[X] = 1/ λ E [X] = 1 /λ
Var(X) = 1/λ² Var(X)= 1 /λ²
协方差和相关 (Covariance and Correlation)
These are both measures that define the degree of association between X and Y. 这些都是定义X和Y之间的关联度的度量。
协方差 (Covariance)
The covariance between X and Y is: X和Y之间的协方差为： Similarly, an easier way to calculate it is: 同样，更简单的计算方法是： Note that covariance only takes into account LINEAR dependence. If X and Y are related in a nonlinear way, they may have covariance = 0. 注意协方差仅考虑了线性相关性。 如果X和Y以非线性方式关联，则它们的协方差= 0。
If X and Y are independent then the covariance between X and Y is zero. Note that covariance of 0 does not imply that they are independent. 如果X和Y是独立的，则X和Y之间的协方差为零。 请注意，协方差为0并不意味着它们是独立的。
相关性 (Correlation)
Measures the strength of a relationship between two variables and ranges from -1 to 1; the normalized version of covariance. 测量两个变量之间关系的强度，范围为-1至1； 协方差的归一化版本。 谢谢阅读！ (Thanks for Reading!)
After reading this, hopefully, you’ll have a fundamental understanding of random variables, probability distribution functions, and more. If you feel that you need to study these concepts more, I would check out my free data science resource that covers probability fundamentals and probability distributions. 阅读本文后，希望您对随机变量，概率分布函数等有基本的了解。 如果您认为您需要进一步研究这些概念，那么我将检查我的免费数据科学资源 ，其中涵盖了概率基础和概率分布。
特伦斯·辛 (Terence Shin)
Check out my free data science resource with new material every week! 每周 查看 我的免费数据科学资源 以及新材料！ If you enjoyed this, follow me on Medium for more 如果您喜欢这个，请 在Medium上关注我以 了解更多 Let’s connect on LinkedIn 让我们在 LinkedIn上建立联系 翻译自: https://towardsdatascience.com/an-in-depth-crash-course-on-random-variables-a3905d03e322离散随机变量和连续随机变量
展开全文  python 机器学习 java 算法
• 随机变量序列，也就是随机变量形成的序列。有时候为了简称，省略了变量二字。 随机变量：表示随机现象（在一定条件下,并不总是出现相同结果的现象称为随机现象）各种结果的变量（一切可能的样本点）。随机序列：随机...
随机序列的定义

随机序列（random sequence），更确切 的，应该叫做，随机变量序列。随机变量序列，也就是随机变量形成的序列。有时候为了简称，省略了变量二字。
随机变量：表示随机现象（在一定条件下,并不总是出现相同结果的现象称为随机现象）各种结果的变量（一切可能的样本点）。随机序列：随机序列的产生为了形容随机变量形成的序列。
一般的，如果用X1，X2……Xn（表示n下标于X）代表随机变量，这些随机变量如 果按照顺序出现，就形成了随机序列，记 做X^n（表示n上标于x）。这种随机序列 具备两种关键的特点：其一，序列中的每个变量都是随机的；其二，序列本身就是随机的。

随机序列举例说明

为了说明什么是随机序列，我们来举几个例子。

PS：下面例子中的N或n可以取>=2的整数。（我理解上是这样，如有理解错误请指正）

例一：

假设我们持续扔一个色子，我们把这个事 件细分，那么这个事件应该包括扔第一次 色子得到的点数，扔第二次得到的点数， 直到扔第n次得到的点数。把每次扔的的 点数按顺序分别记做X1，X2……，Xn。这 里每个X的取值可能为{1 2 3 4 5 6}。那么 我们可以写出随机序列：
X^n = X1X2X3……Xn

例二：

更实际的，我们可以用高速路收费站来说 明。假设一个收费站有10个出口。那么， 把收费站出口出去的车数记做随机变量Xn ，这里Xn就是集合{X1，X2……，Xn}，集 合中每个元素的取值为{0 1 2 3 4 5 6 7 8 9 10}。那么如果按照时间顺序观察，不难得 出一个随机序列，这个序列表示出口出去 车数的一个变化情况，是一个序列，记做 ：
X^n = X1X2X3……Xn

例三：

假设你只用同一个硬币,假设出现正面的概率是p,那么你投硬币出现正面或者是反面,这是随机的.
我们构造一个随机变量 Xn = 出现正面的次数 / 投币次数n.注意,n是指投币总次数.
Xn 对于任意给定的n,这明显是一个随机变量.
然后呢,n如果从1到N,这是一个随机变量序列.
然后呢,从X1到XN,该随机变量序列里的每一个元素,都是一个随机变量.
然后呢,当正整数n趋向于无穷大,我们说,Xn 收敛于X,这个X可以是一个随机变量,也可以是一个实数.
在我们这个例子里,X是一个实数,就是p。

例四：

一个城市的每天的用电量是一个随机变量Y,每家每户的用电量 可以设为Xi,(i=1,2,3,.....),那么Y=X1+X2+X3+......, 这X1,X2,X3.....就是一个随机变量的序列。

展开全文 • 1.3 多维随机变量及其分布 一、二维随机变量 定义 1.3.1： 设设设 EEE 为一个随机试验，其样本空间为一个随机试验，其样本空间为一个随机试验，其样本空间 S={e},X=X(e)S=\{e\},X=X(e)S={e},X=X(e) 及及及 Y(e)Y(e)...
1.3 多维随机变量及其分布

一、二维随机变量

定义 1.3.1：  $设$ $E$ $为一个随机试验，其样本空间$ $S=\{e\},X=X(e)$ $及$ $Y(e)$ 是定义在 $S$ $上的两个随机变量，由她们构成的联合随机变量$ $(X,Y)$ $称为二维随机变量或二维随机向量。$
分布函数： $设$ $(X,Y)$ $是定义在$ $S上的二维随机变量，对于任意实数$ $x,y,$ $二元函数：$
$F(x,y) = P\{X \leq x,Y \leq y\}$

例题1：  将 $P\{x_1 转换为分布函数表达式

答案：
$F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)$

1. 二维分布函数的性质：

$F(x,y)$ $是变量$ $x$ $和$ $y$ 的不减函数，即
$\forall x_1 \leq x_2,F(x_1,y) \leq F(x_2,y)$$\forall y_1 \leq y_2,F(x,y_1) \leq F(x,y_2)$
$0 \leq F(x,y) \leq 1$，且对固定的 $x$，$F(x,-\infty) = 0$且对固定的 $y$，$F(-\infty,y)=0$ 且$F(- \infty,-\infty)=0$$F(+ \infty,+\infty)=1$
$F(x,y)$ 关于变量 $x$ 和 $y$ 均是右连续的，即 $\forall x,y$ 有 $F(x+0,y)=F(x,y)=F(x,y+0)$
对于任意的 $x_1 \leq x_2,y_1 \leq y_2$，下述不等式成立：$F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) \geq0$

2. 二维离散型随机变量：

定义 1.3.3： 若二维随机变量 $(X,Y)$ 的所有可能取值是有限对或可列多对：$(X,Y)=(x_i,y_i) \space\space\space i,j=1,2....$
满足以下性质：

$p_{ij} \geq 0 \space\space\space\space i,j=1,2....$
$\sum_{i=1}^{\infty}\sum_{j=1}^{\infty}p_{ij}=1$

分布函数： $F(x,y)=P\{X \leq x,Y\leq y\} = \sum_{x_i \leq x}\sum_{y_j \leq y}p_{ij}$
X的边缘分布律： $p_{i.}=P\{X=x_i\}=\sum_{j=1}^{\infty}p_{ij} \space\space\space i=1,2...$
X的边缘分布函数： $F_X(x)=F(x,+\infty)=\sum_{x_i \leq x}\sum_{y_j \leq +\infty}p_{ij}=\sum_{x_i \leq x}(\sum_{j=1}^{\infty}p_{ij})=\sum_{x_i\leq x}p_{i.}$
同理：
Y的边缘分布律： $p_{.j}=P\{Y=y_j\}=\sum_{i=1}^{\infty}p_{ij}\space\space\space j=1,2...$
Y的边缘分布函数： $F_Y(y)=F(+\infty,y)=\sum_{x_i \leq +\infty}\sum_{y_i \leq y}p_{ij}=\sum_{y_j \leq y}(\sum_{i = 1}^{\infty}p_{ij})=\sum_{y_j\leq y}p_{.j}$

例题2：

补满下表

x\y
1
2
3
$p_{i.}$

1
0
$\frac{1}{6}$
$\frac{1}{12}$

2
$\frac{1}{6}$
$\frac{1}{6}$
$\frac{1}{6}$

3
$\frac{1}{12}$
$\frac{1}{6}$
0

$p_{.j}$

x\y
1
2
3
$p_{i.}$

1
0
$\frac{1}{6}$
$\frac{1}{12}$
$\frac{1}{4}$

2
$\frac{1}{6}$
$\frac{1}{6}$
$\frac{1}{6}$
$\frac{1}{2}$

3
$\frac{1}{12}$
$\frac{1}{6}$
0
$\frac{1}{4}$

$p_{.j}$
$\frac{1}{4}$
$\frac{1}{2}$
$\frac{1}{4}$
1

根据上表求 $F_X(2),F_Y(3)$

$F_X(2)=\frac{3}{4},F_Y(3)=1$

3. 二维连续型随机变量：
定义1.3.5： $设二维随机变量$ $(X,Y)$ $的分布函数为$ $F(x,y)$ $若存在一个非负可积函数的二元函数$ $f(x,y)$，$使它对于任意实数$ $x,y$ 都有 $F(x,y)=\int_{-\infty}^x \int_{-\infty}^y f(x)dxdy$
$则称$ $(X,Y)$ $为二维连续随机变量$，$函数$ $f(x,y)$ $称为二维随机变量$ $(X,Y)$ 的概率密度，或称为随机变量 $X$与 $Y$ 的联合概率密度。
满足以下性质：

$f(x,y) \geq 0 \space\space\space -\infty < x,y < +\infty$
$\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x)dxdy=1$
若 $f(x,y)$ 在点 $(x,y)$ 连续，则$\frac{\delta^2F(x,y)}{\delta x\delta y}=f(x,y)$
随机点 $(X,Y)$ 落在平面区域 $D$ 内的概率 $P\{(x,y)\in D\}={\int\int}_Df(x,y)dxdy$

例题3： 已知随机变量 $X$ 和 $Y$ 的联合概率密度为 $f(x,y)=\begin{Bmatrix}Ce^{-(2x+y)} \space\space\space x>0,y>0 \\ 0 \space\space\space 其他 \end{Bmatrix}$
(1) 试求 $C$ 的值
(2) $P\{X

答案：
(1)
由 $1=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dxdy=\int_{0}^{+\infty}\int_{0}^{+\infty}Ce^{-(2x+y)}dxdy=$ $C\int_{0}^{+\infty}e^{-2x}dx\int_{0}^{+\infty}e^{-y}dy=C(-\frac{1}2{}e^{-2y}|_{0}^{+\infty})(-e^{-y}|_{0}^{+\infty})=\frac{C}{2}$ 得 $C=2$ 即 $f(x,y)=\begin{Bmatrix}2e^{-(2x+y)} \space\space\space x>0,y>0 \\ 0 \space\space\space 其他 \end{Bmatrix}$
(2)
$P\{X $2\int_{0}^{+\infty}e^{-2x}dx \space* (-e^{-y})|_{x}^{+\infty}=2\int_{0}^{+\infty}e^{-2x}dx \space * e^{-x}=2\int_{0}^{+\infty}e^{-3x}dx=2(-\frac{1}{3}e^{-3x})|_{0}^{+\infty}=\frac{2}{3}$

$X$ 边缘概率密度函数：$f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy$
故 $X$ 的边缘分布函数 $F_X(x)=\int_{-\infty}^{x}f_X(x)dx$
同理：
$Y$ 边缘概率密度函数：$f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx$
故 $Y$ 的边缘分布函数 $F_Y(y)=\int_{-\infty}^{y}f_Y(y)dy$

二. 条件分布

1. 条件分布律
$P\{Y=y_j|X=x_i\}=\frac{P\{X=x_i,Y=y_j\}}{P\{X=x_j\}}=\frac{p_{ij}}{pi.}=p_{j|i}\space\space\space j=1,2...$
$P\{X=x_i|Y=y_j\}=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}}=\frac{p_{ij}}{p.j}=_{i|j}\space\space\space i=1,2...$
例题4： 设 $(X,Y)$ 的概率分布如下表，试求 $X=2$ 的条件分布律

x\y
0
1
2

-1
$\frac{1}{10}$
$\frac{1}{20}$
$\frac{7}{20}$

2
$\frac{3}{10}$
$\frac{1}{10}$
$\frac{1}{10}$

答案：

首先计算 $X=2$ 的边缘分布律为 $\frac{1}{2}$。
当 $X=2$ 的条件分布律为 $P\{Y=0|X=2\}=\frac{\frac{3}{10}}{\frac{1}{2}}=\frac{3}{5},P\{Y=1|X=2\}=\frac{\frac{1}{10}}{\frac{1}{2}}=\frac{1}{5},P\{Y=2|X=2\}=\frac{\frac{3}{10}}{\frac{1}{2}}=\frac{1}{5}$

1.4 随机变量的数字特征

一. 数学期望的概念

定义1.4.1： $设离散型随机变量$ $X$ $的分布律为$ $P\{X=x_k\}=p_k \space\space\space k=1,2...,$ $若级数收敛，则称$ $E(X)=\sum_{k=1}^{\infty}x_kp_k$ $为$ $X$ $的数学期望或概率均值，简称均值或期望$。
$\space\space\space\space$ $设连续型是随机变量$ $X$ 的概率密度为 $f(x)$，$若积分\int_{\infty}^{+\infty}xf(x)dx$ $绝对收敛$，$则称$ $E(X)=\int_{-\infty}^{+\infty}xf(x)dx$ $为连续型随机变量$ $X$ $的数学期望。$
$\space\space\space\space$ $若$ $X$ $的分布律为$ $P\{X=x_k\}=p_k \space\space\space k=1,2...,且\int_{k=1}^{+\infty}g(x_k)p_k$ $绝对收敛，则函数$ $Y=g(X)$ $的期望为$ $E(Y)=E[g(X)]=\sum_{k=1}^{\infty}g(x_k)p_k$ $其中$ $g$ $为连续函数$。
$\space\space\space\space$ $若连续型随机变量$ $X$ 的概率密度为 $f(x)$ $,且\int_{-\infty}^{+\infty}f(x)dx$ $绝对收敛，则函数$ $Y=g(X)$ $的期望为$ $E(Y)=E[g(X)]=\int_{-\infty}^{+\infty}g(x)f(x)dx$
数学期望的性质：

(线性法则)：$E(aX+b)=aE(X)+b$
(加法法则):  $E(X+Y)=E(X)+E(Y)$
(乘法法则)：当随机变量 $X,Y$ 相互独立时 $E(XY)=E(X)E(Y)$
(柯西-许瓦兹不等式)： $|E(XY)|^2 \leq E(X^2)E(Y^2)$

柯西-许瓦兹不等式证明过程

均值向量表示： $E(x)=avg(x)=\frac{1^Tx}{n}$
去均值向量： $\tilde{x} = x-avg(x)1$ 去均值向量的特性：$avg(\tilde{x})=0$

例题5： 设 $X$ 的分布律为

X
-2
-1
0
1

$p_k$
$\frac{1}{4}$
$\frac{1}{8}$
$\frac{1}{2}$
$\frac{1}{8}$

求 $Y=X^2 -1$ 的数学期望。

二. 方差的概念

定义1.4.2： $设$ $X$ $是一个随机变量，若$ $E\{[X-E(X)]^2\}$ $存在，则称$ $E\{[X-E(X)]^2\}$ $为$ $X$ $的方差，记做$ $D(X)$ $或$ $Var(X)$ $或$ $\sigma_x^2$ $。即$ $D(X)=Var(X)=E\{[X-E(X)]^2\}=\sigma_x^2$ $称$ $\sigma_x=\sigma(X)=\sqrt{D(X)}$ 为 $X$ $的标准差或均方差。$
由方差的性质易得：$D(X)=E(X^2)-[E(X)]^2$ $E(X^2)=D(X)+[E(X)]^2$

证明过程：$D(X)=E\{[X-E(X)]^2\}=E\{X^2-2XE(X)+[E(X)]^2\}$ 由期望的加法性质 $E(aX+b)=aE(x)+b$ 可得 $D(X)=E(X^2)-2E(X)E(X)+[E(X)]^2=E(X^2)-[E(X)]^2$
方差是反应数据疏散程度特征得量。方差大，说明数据疏散；方差小，说明数据集中。

方差的矩阵表示： $D(x)=\frac{\tilde{x}^T\tilde{x}}{n}=\frac{<\tilde{x},\tilde{x}>}{n}=\frac{||\tilde{x}||_2^2}{n}$

三. 协方差、相关系数

定义1.4.3： $设$ $(X,Y)$ $为二维随机变量，称$ $Cov(X,Y)=E[(X-E(X))(Y-E(Y))]$ $为$ $X$ $与$ $Y$ $的协方差$。
由方差和协方差性质易得 $D(X+Y)=D(X)+D(Y)+2Cov(X,Y)$ $Cov(X,Y)=E(XY)-E(X)E(Y)$

证明过程：

$Cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E[XY-YE(X)-XE(Y)+E(X)E(Y)]=$ $E(XY)-E(Y)E(X)-E(X)E(Y)+E(X)(Y)=E(XY)-E(X)E(Y)$
$D(X+Y)=E[(X+Y-E(X+Y))^2]=E[(X-E(X)+Y-E(Y))^2]=$ $E[(X-E(X))^2+(Y-E(Y))^2+2(X-E(X))(Y-E(Y))]=$ $E[(X-E(X))^2]+E[(Y-E(Y))^2]-2E[(X-E(X))(Y-E(Y))]=D(X)+D(Y)-2Cov(X,Y)$

协方差得基本性质：

$Cov(X,Y)=Cov(Y,X)$
$Cov(aX,bY)=abCov(Y,X)$
$Cov(X_1\pm X_2,Y)=Cov(X_1,Y)\pm Cov(X_2,Y)$
$|Cov(X,Y)|\leq \sqrt{D(X)}\sqrt{D(Y)}$
$Cov(X,X)=D(X)$
若 $X$ 和 $Y$ 相互独立，则 $Cov(X,Y)=0$
$Cov(aX\pm b,cY\pm d)=acCov(X,Y)$

协方差是反映量随机变量 $X$ 和 $Y$ 相关关系的特征量，它与 $X$ 与 $Y$ 是同量纲的，而反应 $X$ 与 $Y$ 相关关系的无量纲的是相关系数。

协方差的矩阵表示： $Cov(a,b)=\frac{\tilde{a}^T\tilde{b}}{n}=\frac{<\tilde{a},\tilde{b}>}{n}$

定义1.4.4： $设$ $(X,Y)$ $为二维随机变量$，$D(X),D(Y),Cov(X,Y)$ $分别为$ $(X,Y)$ $方差与协方差，称$ $\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$ $为随机变量$ $X$ 与 $Y$ $相关系数。$
相关系数的性质：

$|\rho_{XY}|\leq 1$，$\rho$ 是一个表征 $(X,Y)$ 同线性相关紧密程度的量， $|\rho|$ 较大表示 $(X,Y)$ 线性相关程度较高，反之较低。
若 $(X,Y)$ 相互独立，且 $D(X),D(Y)>0$，则 $\rho_{XY}=0$。若 $(X,Y)$ 的相关系数 $\rho_{XY}=0$，则称 $X$ 与 $Y$ 不相关。

相关系数矩阵表示： $\rho_{ab}=\frac{\frac{\tilde{a}^T\tilde{b}}{n}}{\sqrt{{\frac{\tilde{a}^T\tilde{a}}{n}}}\sqrt{{\frac{\tilde{b}^T\tilde{b}}{n}}}}=\frac{\tilde{a}^T\tilde{b}}{\sqrt{\tilde{a}^T\tilde{a}}\sqrt{\tilde{b}^T\tilde{b}}}=\frac{\tilde{a}^T\tilde{b}}{||\tilde{a}||_2||\tilde{b}||_2}=\cos\angle(\tilde{a},\tilde{b})$ 展开全文 • 实例 离散性随机变量： ...如果变量可以在某个区间内取任一实数，即变量的取值可以是连续的，这随机变量就称为连续型随机变量，比如，公共汽车每15分钟一班，某人在站台等车时间x是个随机变量，x的取值范围是
• 随机变量生成算法——通过Rayleigh变量（或均匀分布变量）转换为高斯随机变量 算法介绍 由随机过程的理论知两个相互独立的高斯随机变量的均方根是Rayleigh分布的随机变量。 首先，由高斯随机变量的定义可得其概率... c++
• 2.1 随机变量 开宗明义，定义先行。作为第二章的第一小节，他的主要任务就是去讲为什么要有随机变量和什么是随机变量。 先来看为什么要有随机变量： 引入随机变量按我的理解就是为了把语文转化为数学，即把用语言去...
• 文章目录3.1 二维随机变量二维随机变量及其分布函数二维离散型随机变量二维连续型随机变量 二维随机变量及其分布函数 上一章里我们都是用一个随机变量XXX来表述概率的。但是在现实生活里影响事情发生概率的随机变量...
• 文章目录二元随机变量，离散型随机变量分布律二元随机变量二元离散型随机变量（一）离散型随机变量的联合概率分布律联合分布律的性质 二元随机变量，离散型随机变量分布律 二元随机变量 定义： 设 EEE 是一个随机...
• 离散型随机变量及其分布率 若随机变量XXX只能取有限个数值x1,x2,...,xnx_1,x_2,...,x_nx1​,x2​,...,xn​或可列无穷多个数值x1,x2,...,xn,...x_1,x_2,...,x_n,...x1​,x2​,...,xn​,...，则称XXX为离散型随机变量... 数理统计
• 随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。 它是由于随机而获得的非确定值，是概率中的一个基本概念。 在经济活动中，随机变量是某一事件在相同的条件下可能发生也可能不发生的事件。 例如...
• 概率论知识回顾（五） 重点：随机变量，离散随机变量分布 什么是随机变量随机变量的作用是什么？为什么要是用随机变量这一定义？ 什么是概率分布？ 离散型随机...
• 算法介绍由随机过程的理论知两个相互独立的高斯随机变量的均方根是Rayleigh分布的随机变量。首先，由高斯随机变量的定义可得其概率密度为：此时，令即进行如下所示的的坐标变换（即极坐标变换）：由该坐标变换可将原...
• ## 理解随机变量

千次阅读 2019-06-06 10:28:09
随机变量 在许多概率模型中试验结果是数值化的，例如，许多仪器的仪表的读数，以及股价等。 也有其他一些例子中的试验结果不是数值化的，但是呢，这些试验结果是与某些数值相联系的。例如： 连续抛掷一枚硬币共5次...
• 二维随机变量与二维离散型随机变量问题引入定义例二维随机变量的分布函数定义二维随机变量分布函数的几何意义二维随机变量分布函数的计算二维随机变量分布函数的性质例二维离散型随机变量的定义例例 问题引入 ...
• 第三章 多维随机变量及其分布 3.4相互独立的随机变量 定义： 简单说就是事件X跟Y没啥关系。故他俩一起发生的概率等于他们单独都发生的概率。 对于离散型随机变量： 例： 解： 对于连续型随机变量： 例 如图：...
• 《概率、随机变量与随机过程》美）帕普里斯，（美）佩莱 著，保铮，冯大政 等译-概率、随机变量与随机过程 [Probability, Random Variables and Stochastic Processes]-Xi’an Jiaotong University Press (2000)
• 文章目录2.2 离散型随机变量及其概率分布一：离散型随机变量的分布律二：常见离散型随机变量的概率分布：两点分布二项分布泊松分布几何分布 一：离散型随机变量的分布律 特点： 这个我们并不陌生，高中的时候那道...
• 2.3 随机变量的分布函数 先来看分布函数是什么： 性质： 说明： 分布函数主要研究随机变量在某一区间内取值的概率情况。 分布函数F(x)F(x)F(x) 是xxx的一个普通的实值函数。 上述的定义和性质对离散型随机变量...
• 多维随机变量（函数）的数学期望和方差若二维随机变量 的分布用联合分布列 或用联合密度函数 表示，下面讨论：1.多维随机变量的数学期望和方差在离散场合： 的数学期望 的方差： 同样可给出 的数学期望和方差。在...
• 1二元随机变量的定义 2二元离散型随机变量的定义、联合概率分布律、边际分布律、条件分布律 3二元离散型随机变量联合概率分布律函数、边际分布函数、条件分布函数 4二元连续型随机变量的定义、联合概率...
• 机器学习的数学基础 ...重要公式与结论随机变量及其概率分布1.随机变量及概率分布2.分布函数的概念与性质3.离散型随机变量的概率分布4.连续型随机变量的概率密度5.常见分布6.随机变量函数的概率分布7... 机器学习 人工智能 python 算法
• 随机变量生成算法——产生离散型随机变量样本值的方法 算法介绍 设离散型随机变量X具有分布律 现在来产生X的随机数： 先产生伪随机数u，令 由于 所以X具有给定的分布律。 下面将引用浙大版概统（第四版）中的例题... matlab c++
• ## 随机变量X

千次阅读 2018-09-11 15:20:18
总结一下在概率论和应用随机过程中随机变量的定义。 1.概率论 把试验中所观察的对象用X表示，X具有这样的特点：随着试验的重复X可以取不同值，并且在每次试验中X取什么值不能提前知道，是带有随机性，若满足称X... 随机过程
• 本章的主要内容有：随机变量及其分布函数，离散型随机变量的概率分布，连续型随机变量的概率密度，常用的离散型和连续型的随机变量随机变量函数分布。
• ”世界上有两类变量：确定变量和随机变量。“ 思考： 何为随机变量？何为变量？ 离散变量相加，连续变量积分？ 变量与常量 变量与常量相对，它们是数学中表征事物量的一对概念。 常量与变量（constant and ...  ...