随机变量
对于概率空间 ,一个 随机变量 是定义在 上的实值函数。随机变量是对试验结果的描述,例如,考虑 和随机变量 ,这个随机变量可以描述一次投掷骰子的试验中,骰子的结果是否大于 ;再比如,考虑 和随机变量 ,这个随机变量可以描述向一个半径为 的区域掷飞镖时,落点到原点的距离。
离散型随机变量
离散型随机变量是定义在离散样本空间上的随机变量。这意味着离散型随机变量的定义域 是离散的,或 内的元素是有限或可数的。
概率密度函数
对于离散型随机变量,我们会关心它在取得各种值时的概率。具体来说,我们关心 的值。我们称这个值为离散型随机变量的 概率密度函数 (Probability density function,PDF),也称 分布律 和 概率函数 等。接下来我们更加严谨地定义一下这个概念:
设 是样本空间 上的一个随机变量,它的概率密度函数是 取得某值的概率:
因为概率的总和为 ,因此概率密度函数的总和也是 ,并且对于任何 都有 。
累计分布函数
除了概率密度函数,我们有时还会关心一个随机变量小于等于某数的概率,即 。这个概率可以通过将所有小于等于 的概率加起来得到,我们称这个概率为 的 累计分布函数(cumulative distribution function,CDF)。它的定义如下:
设 是样本空间 上的一个随机变量,它的累计分布函数是 小于某值的概率:
累计分布函数可以用来求出 随机变量落在某区间的概率 。例如,随机变量 在 上的概率就是 。
由于概率是一个大于 小于 的值,因此累计分布函数是一个从 开始的递增函数,并且最终增长到 。我们有以下结论:
连续型随机变量
将上面离散型随机变量中 由离散改为连续,就得到了 连续型随机变量 。
连续随机变量的分布函数
对应的,我们可以给出连续随机变量概率密度函数和累计分布函数的定义:
设 是样本空间 的一个随机变量,其中 是不可数的。 的 累积分布函数 是它小于某值的概率:
而 的 概率密度函数 可以看成是其累计分布函数的导数。设 的累计分布函数为 ,如果一个函数 满足:
则称 是 的概率密度函数。通过上面的定义,我们可以看出:
- ,因为概率总是正的。
- ,因为总概率为 。
Comments NOTHING