Skip to main content

概率论

面试常考问题

  1. 简述大数定理。

    大数定理描述了大样本情况下随机变量的均值与其期望值之间的关系。对于独立同分布的随机变量序列,随着样本数量的增加,样本均值会以较高的概率接近其期望值。

  2. 简述中心极限定理。

    当独立随机变量的数量足够大时,它们的和(或平均值)的分布会逐渐接近一个正态分布。即使原始随机变量不服从正态分布,但当样本容量足够大时,和(或平均值)的分布仍然呈现出正态分布的特征。

  3. 什么是全概率公式。

    对于事件A而言,假设有一组互斥且穷尽的条件事件B,则事件A的概率等于事件A在每个条件事件下发生的概率与该条件事件发生概率的乘积和。

  4. 什么是最大似然估计。

    基本思想是在已知观测数据的情况下,通过调整参数的取值,找到使得观测数据出现概率最大的参数值。

    大致过程:

    1. 构建参数化的概率模型,即构建似然函数,表示在给定参数下观测数据出现的概率
    2. 取似然函数的对数,方便计算与优化
    3. 最大化似然函数,求解参数的最优值
  5. 简述贝叶斯定理。

    贝叶斯定理描述了在给定观测数据的条件下,计算事件的后验概率的方法。

    P(AB)=P(BA)P(A)P(B)P(A|B) = \frac{P(B|A) * P(A)}{P(B)}

    其中:

    • P(AB)P(A|B)表示在观测到事件 B 发生的条件下,事件 A 发生的概率,称为后验概率
    • P(BA)P(B|A)表示在事件 A 发生的条件下,事件 B 发生的概率,称为似然;
    • P(A)P(A)P(B)P(B)分别是事件 A 和事件 B 独立发生的先验概率。

    优点:它能够将主观先验知识与观测数据相结合,通过不断更新后验概率来进行推断和决策。

  6. P问题、NP问题以及NP完全问题

    tip

    P stands for Polynomial

    意为多项式

    P问题是可以在多项式时间内解决的问题

    NP问题是可以在多项式时间内验证解的正确性的问题

    NP完全问题是一类特殊的NP问题,没有已知的高效解决算法,并且可以在多项式时间内归约到任何其他的NP问题