当前位置：首页 > news >正文

模式识别与机器学习课程笔记（1）：数学基础

news 2025/7/22 7:24:05

模式识别与机器学习课程笔记（1）：数学基础

特征矢量和特征空间
随机矢量的描述
- 随机矢量的分布函数
- 随机矢量的数字特征
- 随机变量、随机矢量间的统计关系
- 随机矢量的变换
正态分布
- 正态分布的定义
- 正态分布随机矢量的性质
离散随机矢量及其分布
信息论
矩阵微分法基本知识
- 矢量或矩阵对于数量变量的微分
- 二、数量函数对于矢量的微分
- 三、矢量函数对于矢量的微分

特征矢量和特征空间

特征量的类型：物理量、次序量、名义量
- 物理量：直接反映特征的实际物理意义。如：长度、重量、速度等。处理前需要离散化。
- 次序量：按某种规则确定的只反映特征的次序关系或等级。如：产品的等级、病症的级或期。已是离散量。
- 名义量：反映样本的状态特征，非数值的。如：男性与女性、事物的状态、种类等。需要数值化。这些特征的数值指标既无数量含义，也无次序关系，只是用数字代表各种状态。
n维特征矢量： $\overrightarrow { x } = ( x _ { 1 } , x _ { 2 } , \cdots , x _ { n } )'$
n维特征空间： $\overrightarrow{x}$ 的全体构成的n维空间记为 $X^n$ 或 $R^n$ 或 $\Omega$

随机矢量的描述

概率的频率观和贝叶斯观
- 频率观：概率是可重复随机事件的频率（的极限值）。
- 贝叶斯观（ Bayesian）：概率是对不确定性的定量描述。
概率论的两条基本规则
加法规则和乘法规则： $\sum _ { Y } p ( X , Y ) \\ p ( X , Y ) = p ( Y | X ) p ( X )$
链式法则：
$P(x^{(1)}, \dots, x^{(n)}) = P(x^{(1)}) \prod_{i=1}^{n} P(x^{(i)} \mid x^{(1)}, \dots, x^{(i-1)})$

随机矢量的分布函数

随机矢量： $\overrightarrow { X } = ( X_ { 1 } , X_ { 2 } , \cdots , X_ { n } )'$
确定性矢量： $\overrightarrow { x } = ( x _ { 1 } , x _ { 2 } , \cdots , x _ { n } )'$
随机矢量的联合概率分布函数：
$\ldots , x _ { n } ) = P ( X _ { 1 } \leq x _ { 1 } , X _ { 2 } \leq x _ { 2 } , \ldots , X _ { n } \leq x _ { n } )$
随机矢量的联合概率分布函数：
$\ldots , x _ { n } ) \stackrel { \Delta } { = } p ( \overrightarrow { x } ) = \partial ^ { n } F ( x _ { 1 } , x _ { 2 } , \ldots , x _ { n } ) / \partial x _ { 1 } \partial x _ { 2 } \ldots \partial x _ { n }$
类概率分布和类概率密度函数：
$\overrightarrow { x } | \omega _ { i } ) = P ( \overrightarrow { X } \leq \overrightarrow{ x } | \omega _ { i } ) \\ p ( \overrightarrow { x } | \omega _ { i } ) = \partial ^ { n } F ( x _ { 1 } , x _ { 2 } ,\cdots, x _ { n } | \omega _ { i } ) / \partial x _ { 1 } \partial x _ { 2 } \cdots \partial x _ { n }$

随机矢量的数字特征

均值矢量： $\overrightarrow { \mu } = E [ \overrightarrow{X} ] =\overrightarrow{ \overline{ X }} = \begin{bmatrix} E [ X _ { 1 } ] \\ E [ X _ { 1 } ] \\ \\E [ X _ { 2 } ] \end{bmatrix} = \int _ {X^ {n} } \overrightarrow { x } p ( x ) d \overrightarrow { x }$
条件期望：
$\overrightarrow { \mu } _ { _ {w_ i } } = E \left[ \overrightarrow { X } \mid \omega _ { i } \right] = \int_{\overrightarrow { x } \in \omega _ { i } } \overrightarrow { x } p(\overrightarrow{x} \mid \omega_i) d\overrightarrow{x}$
协方差矩阵
$\Sigma = E \left[ ( \overrightarrow { X } - \overrightarrow { \mu } ) ( \overrightarrow { X } - \overrightarrow { \mu } ) ^ { \prime } \right] = \int _ { {X}^n } ( \overrightarrow { x } - \overrightarrow { \mu } ) ( \overrightarrow { x } - \overrightarrow { \mu } ) ^ { \prime } p ( \overrightarrow { x } ) d \overrightarrow { x } = ( \sigma _ { i j }^2 ) _ { n \times n }$
自相关矩阵:自相关矩阵定义为 $E[\mathbf{X} \mathbf{X}^T]$