新書推薦:

《
萤火虫全球史072:图说中世纪医学简史
》
售價:HK$
82.5

《
汉字中国:承载三千年中华文化的瑰宝
》
售價:HK$
42.9

《
自我救赎:战胜复杂性创伤的行动指南
》
售價:HK$
64.9

《
罗马和平新版 古代地中海世界的暴力 征服与和平 汗青堂丛书109
》
售價:HK$
116.6

《
万亿低空:应用实战篇 低空经济
》
售價:HK$
107.8

《
最美中国版画100幅 艺术百图系列 木版雕刻 经典古版画 中式美学 周亮编著
》
售價:HK$
85.8

《
乱世离歌:五代史略
》
售價:HK$
107.8

《
近代中国史学述论(修订版)
》
售價:HK$
118.8
|
| 內容簡介: |
|
《大数据概率理论基础》着重介绍大数据建模与分析中常用的概率极限理论,主要内容包括相依随机变量和过程的极限理论、Stein方法及其应用、自正则化极限理论、高维样本协方差矩阵的谱统计量渐近分布理论、随机梯度方法及其应用、随机复杂网络的整体和局部结构、分布式统计推断方法和渐近理论、Gauss逼近原理及其应用等。
|
| 目錄:
|
|
目录《大数据与数据科学专著系列》序前言第1章 **极限理论 11.1 基本概念 11.1.1 概率空间 11.1.2 条件概率 31.1.3 *立性 31.1.4 随机变量及其分布 41.1.5 二维随机向量 61.1.6 多维随机向量 81.1.7 数学期望 91.1.8 方差 111.1.9 协方差 121.1.10 条件期望 131.1.11 特征函数 131.1.12 矩量法 141.1.13 随机变量的收敛 151.1.14 **极限定理 181.2 大数定律 181.3 中心极限定理 211.3.1 常用证明方法 221.3.2 Berry-Esséen界 231.3.3 Cramér中偏差 251.3.4 Edgeworth展开 251.4 弱不变原理 261.5 强不变原理 301.6 附注 311.7 习题 33第2章 相依序列极限定理 392.1 相依随机序列 392.1.1 鞅 392.1.2 平稳序列 412.1.3 Markov链 412.2 平稳随机序列遍历性 432.2.1 均值遍历性 442.2.2 强遍历性 472.3 鞅中心极限定理 492.3.1 平稳鞅差序列 492.3.2 鞅差组列 512.4 鞅逼近方法 512.5 Markov链中心极限定理 602.6 线性过程中心极限定理 682.7 应用 742.8 附注 782.9 习题 80第3章 Stein方法 823.1 Stein引理和Stein方程 823.2 *立随机变量的部分和 863.3 非线性统计量 943.3.1 非线性统计量的Berry-Esséen界 943.3.2 U-统计量 993.4 可交换对 1003.4.1 基本概念和性质 1013.4.2 L1界 1023.4.3 Berry-Esséen界 1113.5 非正态逼近 1153.5.1 L1界 1173.5.2 Berry-Esséen界 1183.5.3 应用:Curie-Weiss模型 1193.6 附注 1223.7 习题 123第4章 自正则化极限理论 1284.1 依分布收敛 1284.1.1 *立同分布情形 1294.1.2 *立非同分布情形 1324.2 Berry-Esséen界 1324.3 自正则化大偏差定理 1354.4 自正则化中偏差定理 1414.5 Cramér型中偏差定理 1464.6 附注 1524.7 习题 153第5章 高维协方差矩阵 1555.1 **多元统计分析理论 1555.1.1 主成分分析 1575.1.2 无线性分布 1585.2 经验谱分布 1605.2.1 Mar?enko-Pastur分布 1615.2.2 Stieltjes变换 1625.2.3 经验谱极限分布 1655.3 线性特征根统计量的中心极限定理 1685.4 极值特征根的渐近分布 1745.4.1 极值特征根的几乎必然收敛性 1745.4.2 Tracy-Widom分布 1775.4.3 极值特征根的渐近分布 1825.5 有限秩扰动 1845.6 附注 1875.7 习题 192第6章 随机梯度下降法 1976.1 强凸函数优化 1986.1.1 凸函数和强凸函数 1986.1.2 简单随机梯度下降法 2026.2 随机逼近的收敛性 2076.2.1 线性方程组求解 2076.2.2 非线性问题求解 2126.2.3 *小均方算法 2146.3 非凸函数优化 2156.4 附注 2226.5 习题 225第7章 随机复杂网络 2287.1 图的基本概念 2287.2 Erd?s-Rényi随机图 2307.2.1 ER 随机图的演化和相变 2327.2.2 ER 随机图顶点度的分布 2377.3 偏好依附模型 2417.4 复制模型 2497.4.1 顶点的估计 2517.4.2 顶点度的估计 2537.5 谱半径 2547.6 半圆律 2567.7 区块检测 2607.8 附注 2627.9 习题 264第8章 分布式参数统计推断 2678.1 分布式一步估计法 2688.1.1 线性平均估计 2688.1.2 中位数估计 2708.2 指数型分布族分布式参数估计 2788.3 Newton-Raphson迭代法 2858.3.1 分布式估计Newton型迭代法 2858.3.2 分布式估计Newton型迭代法 2888.4 加权分布式估计 2988.5 附注 3028.6 习题 304第9章 Gauss逼近 3109.1 Gauss 随机向量部分量的最大值 3199.2 *立随机向量部分和的最大分量 3249.2.1 条件*立分布逼近 3249.2.2 强逼近 3269.3 经验过程Gauss逼近 3299.4 应用 3349.4.1 局部经验过程 3349.4.2 轮廓经验过程 3359.4.3 非Gauss模型的Dantzig选择 3379.4.4 伪发现选择 3409.5 附注 3439.6 习题 348附录 常用概率不等式 353A 基本概率不等式 353B *立随机变量部分和的概率不等式 355C 鞅不等式 357D 其他不等式 359参考文献 363《大数据与数据科学专著系列》已出版书目 375
|
| 內容試閱:
|
|
第1章**极限理论 1.1基本概念 1.1.1概率空间 概率空间是概率论中的重要概念,是现代概率论的严格定义的基础。概率空间由三要素组成:样本空间、事件域和概率,通常记为。具体地说: 样本空间表示随机试验(现象)所有可能的基本结果;事件是样本空间的子集,通常用表示。类似于集合运算,可定义事件的运算. 例如,事件A和B的并集表示事件A或B发生;事件A和B的交集(有时简记为AB)表示事件A和B同时发生;事件A的补集A^c表示事件A不发生;事件A和B的差集表示事件A发生而B不发生;称为不可能事件,为必然事件。 事件域F是样本空间\\Omega的子集族,通常也称\\mathcal{F}为\\sigma-域或\\sigma-代数,满足下列条件: (i) (ii) (iii) 概率满足下列条件: (i‘)规范性 (ii’)可列可加性 如果是一列互不相容事件,那么。 概率空间是随机试验(现象)高度抽象化的数学模型,其核心是概率,不同的代表着不同的概率模型。建立恰当的概率模型需要对随机试验(现象)有着充分了解,往往需要有关学科的背景知识。初等概率论主要介绍计算或估计事件的概率大小,从一些简单事件的概率开始,通过事件运算和概率运算来计算复杂事件的概率。 在以下讨论中,我们假设所有的事件都是由事件域中的事件组成的,且是定义在上的概率。许多概率运算性质可以由上述(i‘)和(ii’)推出,如: (a) (b) (c) (d) (e) (f) 如果,那么事件A发生的概率为1,我们称事件A为几乎必然事件;如果,那么事件A不发生的概率为1,我们称事件A为几乎不可能事件。注意到几乎必然事件和几乎不可能事件是概率论中的特殊事件,与必然事件和不可能事件不同。在接下来的部分里,如果A是几乎必然事件,我们简记为Aa.s.(almost surely)。 1.1.2条件概率 假设,定义 称(A|B)为在给定B发生的条件下,A发生的条件概率。 对于任意概率为正的事件B,容易验证测度满足条件和,从而为概率空间(留作习题)。 条件概率是计算事件概率的一个强有力工具,其中*为常用的是全概率公式、链式法则和贝叶斯公式。 假设是一组互不相交的事件,其中为有限或可数指标集,满足,那么对任意事件A, 我们称式(1.2)为全概率公式。 特别地,任意给定B,如果,那么。 注意到式(1.1)可以改写成,该式可以推广到多个事件,得下列链式法则(也称为乘法公式):对任意(假设所有条件概率的分母都大于0)。 贝叶斯公式是概率论中的另一个重要公式。假设是一组有限或者可数个互不相交事件,并且,那么对任意事件A以及某。 1.1.3*立性 如果 称事件A和B相互*立。若,则由式(1.1)得A和B相互*立等价于 等式(1.4)意味着事件B发生与否对于事件A发生的概率大小没有影响。特别地,不可能事件、必然事件与任何其他事件均相互*立。 *立性概念是概率论学科中*重要的概念之一,可以推广到任意多个事件。具体地,假设满足下列方程:对任意及任意,有,称相互*立。由定义可以看出,如果m个事件相互*立,那么其中任意k个事件都相互*立。 更一般地,假设的两个子域,如果对于任意事件都有A_1和A_2相互*立,则称相互*立。 1.1.4随机变量及其分布 在各种随机试验中,每一个随机事件都可以用一个变量“替代”,一个“具体”变量被称为随机变量。随机变量是概率论中*基本的概念之一,它的具体定义如下:设是概率空间,为实数域上的Borel集,设是一个映射,使得对于任意给定的,则称X是随机变量。根据Borel集的构造,X是随机变量当且仅当对任意实数x,有。 直观地说,随机变量是一种特殊的实值函数,其值小于或等于某实数x的样本点所组成的集合,都是中的事件,所以一个函数是否成为随机变量也跟“什么样的子集算事件”有密不可分的关系。 给定一个随机变量X,定义
|
|