### 数据挖掘与机器学习数学基础 #### 第一章 机器学习的统计基础 **1.1 概率论** 概率论是数据科学的基础之一,它提供了处理不确定性和随机性的工具。掌握概率论的基本概念对理解和应用机器学习算法至关重要。 ##### 1.1.1 基本概念 - **样本空间**: 在任何随机实验中,所有可能结果的集合被称为样本空间,用符号S表示。样本空间中的每个元素被称为样本点。 例如,在一个关于用户学历的随机实验中,样本空间S可以表示为{‘研究生或以上’, ‘本科’, ‘大专’, ‘高中’, ‘中专’, ‘初中及以下’}。 - **事件**: 事件是样本空间S的子集。事件可以分为几种类型:空事件(不包含任何样本点)、原子事件(只包含一个样本点)、混合事件(包含多个样本点)以及样本空间本身(包含了所有样本点)。 - **概率**: 描述事件发生的可能性。对于一个事件A,如果重复试验足够多的次数,那么事件A发生的频率将趋近于一个确定的数值p,这个数值p即为事件A的概率P(A)。概率P(A)满足以下条件: - P(A) ≥ 0; - P(S) = 1; - 如果A₁, A₂, ..., An 是一系列互斥事件,则 P(A₁ ∪ A₂ ∪ ... ∪ An) = P(A₁) + P(A₂) + ... + P(An)。 - **条件概率**: 条件概率P(B|A)表示在已知事件A发生的条件下,事件B发生的概率。计算公式为 P(B|A) = P(A ∩ B) / P(A)。 - **独立性**: 当事件A的发生不影响事件B发生的概率时,称这两个事件是独立的。数学上,如果 P(B|A) = P(B),则事件A和事件B是独立的,等价于 P(A ∩ B) = P(A)P(B)。 - **全概率公式**: 如果事件B将样本空间S分成两个互斥的部分B和B̅(B的补集),那么对于任意事件A有 P(A) = P(A ∩ B) + P(A ∩ B̅) = P(A|B)P(B) + P(A|B̅)P(B̅)。 - **贝叶斯定理**: 描述了在给定一些背景信息的情况下,如何更新关于某些事件发生的概率估计。公式为 P(B|A) = P(A|B)P(B) / P(A),其中P(B)是事件B的先验概率,P(A|B)是给定B发生的条件下A的条件概率,而P(A)是A的边际概率。 #### 1.2 随机变量,期望,方差 **随机变量**是对随机试验结果的一种数值表示。它可以分为离散型和连续型两种。 - **离散型随机变量**: 取值有限或可数无限个值。例如,掷一枚骰子得到的点数是一个离散型随机变量。 - **连续型随机变量**: 取值范围内的任意实数值。例如,一个人的身高可以视为一个连续型随机变量。 **概率分布**描述了随机变量所有可能取值及其对应的概率。对于离散型随机变量,概率分布通常用概率质量函数表示;对于连续型随机变量,则使用概率密度函数来描述。 - **期望(均值)**: 代表随机变量的长期平均值。离散型随机变量的期望计算公式为 E[X] = Σx p(x),连续型随机变量的期望为 E[X] = ∫x f(x) dx,其中f(x)是随机变量的概率密度函数。 - **方差**: 衡量随机变量与其期望值之间的偏差程度。方差的计算公式为 Var(X) = E[(X - μ)²],其中μ是随机变量X的期望。 掌握这些统计学的基础知识对于理解后续的数据挖掘算法及其Python实现至关重要。接下来,我们将深入探讨具体的机器学习算法,并通过Python代码示例来进一步巩固所学的概念。





















剩余111页未读,继续阅读

- yotofu2018-04-16下来看看~~~~

- 粉丝: 2
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- sqlite-jdbc-3.40.0.0.jar中文文档.zip
- sqlite-jdbc-3.41.2.0.jar中文文档.zip
- sqlite-jdbc-3.41.2.1.jar中文文档.zip
- sqlite-jdbc-3.41.2.2.jar中文文档.zip
- sqlite-jdbc-3.42.0.0.jar中文文档.zip
- sqlite-jdbc-3.42.0.1.jar中文文档.zip
- sqlite-jdbc-3.43.0.0.jar中文文档.zip
- 基于Python和TensorRT的RT-DETR目标检测推理代码
- 王者荣耀模拟器:一款基于Python的文本角色扮演游戏
- WxNotificationCenter - 微信小程序通知广播类,降低程序耦合度
- MSPM0G3507_Project_xunji_pid.zip
- 简易PHP登录页面代码示例
- 海风开源海风海风小店微信小程序商城 VUE 管理后台系统
- 微信小程序中的 Cnode 社区版本
- Unity实现自动追踪导弹功能的完整代码
- FX10/20开发工具ModusToolboxSetupInstaller


