实验数据处理方法
2
数据的搜集
数据的整理 数据统计( Statistics)
数据的分析
数据的评估
实验数据处理方法?
? 研究采用 概率论 和 数理统计 知识对实验数据进行处理
(包括搜集、整理、分析、评估等)的方法
实验数据处理方法
第一章 引言
? Statistics的词源是 state(国家) —— 国家的数据统计
对数学的要求
学习这门课的意义
? 实验数据处理与学术道德( 参考 )
? 大规模数据处理与计算机的发展相关
开普勒的行星运动三定律
LHC与 GRID
3
统计( statistics)?
?, 辞海,
1,指统计资料,即反映大量现象数量特征的数字资料。如,人口统计。
2,指统计工作,即搜集、整理、分析和推断统计资料的工作。如统计人数。
3,指统计学。如数理统计、概率统计、医学统计等。
? American Heritage Dictionary
1,The mathematics of the collection,organization,and interpretation of numerical
data,especially the analysis of population characteristics by inference from
sampling,
(与单数动词连用)统计学:搜集、组织、解释数值数据的数学,尤指用样 本分析总体的特征者。
2,Numerical data,
(与复数动词连用)数字数据。
? Merriam-Webster Online Dictionary
1,a branch of mathematics dealing with the collection,analysis,interpretation,and
presentation of masses of numerical data
2,a collection of `quantitative data
实验数据处理方法
第一章 引言
4
数据处理方法?
实验数据处理方法
第一章 引言
? Probability & Statistics
概率论和统计学(数理统计) ——数学的两个分支
? 统计推断( Statistical Reasoning)
根据带随机性的 观测数据,按照问题的条件,选用一
定的 模型,而对未知事物作出的、以 概率 形式表达的
推断。
例如,温度 作为物体冷热程度的量度,并不描述组成
物体的单个分子的能量,而是正比于分子动能的统计
平均值。
与演绎推理相对。
5
实验数据处理方法
第一章 引言
自然科学的最终目标是揭示自然界的基本规律
?概率论证和统计推断方法越来越重要,在某些领域是必不可少的
例如,概率论和统计学方法贯穿高能物理试验的整个过程
? 在实验建议书中,要估计所需的人力和经费,给出实验的要点和设计
方案;
? 在实验开始计划时,要估计试验的规模,即要达到所需的精度,需要
获取多少事例;(绘制直方图时,为避免涨落,需要足够的数据量)
? 在整个实验过程中,要进行大量的 Monte Carlo模拟,估计探测器的
接收度和探测效率;
? 在实验数据获取阶段,在线触发判选系统选择感兴趣的事例,在线计算
机将来自各子探测器的信号进行初步的处理后将该事例写到磁带上;
? 对所记录的事例进行检查,去掉坏事例,修正实验偏差,进行事例重建 ;
? 用理论模型对所得的实验结果进行解释,如果现有的理论模型不能解
释实验结果,就要对模型进行修正,在一些特殊的情况下,将导致新
规律的发现 。
6
实验数据处理方法
第一章 引言
实验 实验结果 理论 统计学 概率论(理论模型)
新的理论模型
新的理论预言
对实验结果进行
理论分析
指导实验
实验与理论之间的关系
7
组合态 态的数目 (24) 磁矩
1
4
6
4
1
-4
-2
0
2
4
0
1
2
3
4
5
6
-4 -2 0 2 4
状态数
通过概率论将理论具体化为统计分布
二项式分布
8
实验数据处理方法
第一章 引言
理论 ?概率和统计 ? 实验
设某一可观测量 x和一组参数 θ之间存在某种对应关系(未知)
理论:给定一组参数 θ,可观测量 x的预期分布形式什么? ?概率论
的问题
实验:给定一组 x的观测值,确定 θ的取值是什么? ?统计学的问题
统计学在粒子物理中的应用主要包括两部分,
参数估计( Parameter Estimation):从一组观测值,用统计的方法求出
未知参数 θ的值及其误差。
径迹拟合(中,P308)
假设检验( Hypothesis Testing):检验理论模型所预言的参数值是否与
实验所得的值一致 。
反应角分布(中,P369)
9
径迹拟合 —— 参数估计的例子
2 2 212( ) ( )i i ir x y??? ? ? ?
12(,)??
(,)iixy
实验数据处理方法
第一章 引言
参数:半径 ri,圆心坐标
12(,)??
观测量:粒子坐标 (,)iixy
10
实验数据处理方法
第一章 引言
第一部分:概率论基础知识;
第二部分,Monte Carlo模拟;
第三部分:统计学方法;
课程内容
11
概率论, 为统计提供必要的工具
概率论是研究随机现象数量规律的数学分支。
? 概率的基本概念:定义、性质
? 概率分布的基本性质:概率密度函数、期望值、误差传递,…
? 特殊的概率分布函数:二项式分布、泊松分布、高斯分布,…
? 实验数据和理论分布的比较:分辨率和探测效率对实验数据的影响
实验数据处理方法
第一章 引言
课程内容
12
Monte Carlo模拟, 概率论的一种应用
利用随机数对随机过程进行数值模拟的方法。
随机过程是随时间演进的随机现象的数学抽象。例
如著名的马尔可夫过程,布朗运动(维纳)等。
实验数据处理方法
第一章 引言
课程内容
13
统计学, 概率论的一种应用
指数理统计学,研究如何有效地收集、整理和分析带
有随机性的数据,并作出推断和预测。这种推断称为统计
推断。数理统计学是随着概率论的发展而发展起来的。当
人们认识到,必须把数据看成是来自具有一定概率分布的
总体,所研究的对象是这个总体而不能局限于数据本身之
日,也就是数理统计学诞生之时。
? 置信区间、置信水平、显著性水平;
? 参数估计的基本概念;
? 最大似然法;
? 最小二乘法;
? 假设检验;
实验数据处理方法
第一章 引言
课程内容
14
实验数据处理方法
第一章 引言
一些常用数据分析软件的使用
参考书,
A.G,Frodesen,Probability and Statistics in
Particle Physics
讲稿,
张学尧
http://hepg.sdu.edu.cn/zhangxueyao
王永刚
http://hepg.sdu.edu.cn/wangyonggang/chinese/work/Dat
aAnalysis/DataAnalysis-ch01.ppt
15
实验数据处理与学术道德
? http://news.xinhuanet.com/edu/2003-
02/08/content_719211.htm
? http://jiaoshi.cer.net/article/20050127/3127
925.shtml
2
数据的搜集
数据的整理 数据统计( Statistics)
数据的分析
数据的评估
实验数据处理方法?
? 研究采用 概率论 和 数理统计 知识对实验数据进行处理
(包括搜集、整理、分析、评估等)的方法
实验数据处理方法
第一章 引言
? Statistics的词源是 state(国家) —— 国家的数据统计
对数学的要求
学习这门课的意义
? 实验数据处理与学术道德( 参考 )
? 大规模数据处理与计算机的发展相关
开普勒的行星运动三定律
LHC与 GRID
3
统计( statistics)?
?, 辞海,
1,指统计资料,即反映大量现象数量特征的数字资料。如,人口统计。
2,指统计工作,即搜集、整理、分析和推断统计资料的工作。如统计人数。
3,指统计学。如数理统计、概率统计、医学统计等。
? American Heritage Dictionary
1,The mathematics of the collection,organization,and interpretation of numerical
data,especially the analysis of population characteristics by inference from
sampling,
(与单数动词连用)统计学:搜集、组织、解释数值数据的数学,尤指用样 本分析总体的特征者。
2,Numerical data,
(与复数动词连用)数字数据。
? Merriam-Webster Online Dictionary
1,a branch of mathematics dealing with the collection,analysis,interpretation,and
presentation of masses of numerical data
2,a collection of `quantitative data
实验数据处理方法
第一章 引言
4
数据处理方法?
实验数据处理方法
第一章 引言
? Probability & Statistics
概率论和统计学(数理统计) ——数学的两个分支
? 统计推断( Statistical Reasoning)
根据带随机性的 观测数据,按照问题的条件,选用一
定的 模型,而对未知事物作出的、以 概率 形式表达的
推断。
例如,温度 作为物体冷热程度的量度,并不描述组成
物体的单个分子的能量,而是正比于分子动能的统计
平均值。
与演绎推理相对。
5
实验数据处理方法
第一章 引言
自然科学的最终目标是揭示自然界的基本规律
?概率论证和统计推断方法越来越重要,在某些领域是必不可少的
例如,概率论和统计学方法贯穿高能物理试验的整个过程
? 在实验建议书中,要估计所需的人力和经费,给出实验的要点和设计
方案;
? 在实验开始计划时,要估计试验的规模,即要达到所需的精度,需要
获取多少事例;(绘制直方图时,为避免涨落,需要足够的数据量)
? 在整个实验过程中,要进行大量的 Monte Carlo模拟,估计探测器的
接收度和探测效率;
? 在实验数据获取阶段,在线触发判选系统选择感兴趣的事例,在线计算
机将来自各子探测器的信号进行初步的处理后将该事例写到磁带上;
? 对所记录的事例进行检查,去掉坏事例,修正实验偏差,进行事例重建 ;
? 用理论模型对所得的实验结果进行解释,如果现有的理论模型不能解
释实验结果,就要对模型进行修正,在一些特殊的情况下,将导致新
规律的发现 。
6
实验数据处理方法
第一章 引言
实验 实验结果 理论 统计学 概率论(理论模型)
新的理论模型
新的理论预言
对实验结果进行
理论分析
指导实验
实验与理论之间的关系
7
组合态 态的数目 (24) 磁矩
1
4
6
4
1
-4
-2
0
2
4
0
1
2
3
4
5
6
-4 -2 0 2 4
状态数
通过概率论将理论具体化为统计分布
二项式分布
8
实验数据处理方法
第一章 引言
理论 ?概率和统计 ? 实验
设某一可观测量 x和一组参数 θ之间存在某种对应关系(未知)
理论:给定一组参数 θ,可观测量 x的预期分布形式什么? ?概率论
的问题
实验:给定一组 x的观测值,确定 θ的取值是什么? ?统计学的问题
统计学在粒子物理中的应用主要包括两部分,
参数估计( Parameter Estimation):从一组观测值,用统计的方法求出
未知参数 θ的值及其误差。
径迹拟合(中,P308)
假设检验( Hypothesis Testing):检验理论模型所预言的参数值是否与
实验所得的值一致 。
反应角分布(中,P369)
9
径迹拟合 —— 参数估计的例子
2 2 212( ) ( )i i ir x y??? ? ? ?
12(,)??
(,)iixy
实验数据处理方法
第一章 引言
参数:半径 ri,圆心坐标
12(,)??
观测量:粒子坐标 (,)iixy
10
实验数据处理方法
第一章 引言
第一部分:概率论基础知识;
第二部分,Monte Carlo模拟;
第三部分:统计学方法;
课程内容
11
概率论, 为统计提供必要的工具
概率论是研究随机现象数量规律的数学分支。
? 概率的基本概念:定义、性质
? 概率分布的基本性质:概率密度函数、期望值、误差传递,…
? 特殊的概率分布函数:二项式分布、泊松分布、高斯分布,…
? 实验数据和理论分布的比较:分辨率和探测效率对实验数据的影响
实验数据处理方法
第一章 引言
课程内容
12
Monte Carlo模拟, 概率论的一种应用
利用随机数对随机过程进行数值模拟的方法。
随机过程是随时间演进的随机现象的数学抽象。例
如著名的马尔可夫过程,布朗运动(维纳)等。
实验数据处理方法
第一章 引言
课程内容
13
统计学, 概率论的一种应用
指数理统计学,研究如何有效地收集、整理和分析带
有随机性的数据,并作出推断和预测。这种推断称为统计
推断。数理统计学是随着概率论的发展而发展起来的。当
人们认识到,必须把数据看成是来自具有一定概率分布的
总体,所研究的对象是这个总体而不能局限于数据本身之
日,也就是数理统计学诞生之时。
? 置信区间、置信水平、显著性水平;
? 参数估计的基本概念;
? 最大似然法;
? 最小二乘法;
? 假设检验;
实验数据处理方法
第一章 引言
课程内容
14
实验数据处理方法
第一章 引言
一些常用数据分析软件的使用
参考书,
A.G,Frodesen,Probability and Statistics in
Particle Physics
讲稿,
张学尧
http://hepg.sdu.edu.cn/zhangxueyao
王永刚
http://hepg.sdu.edu.cn/wangyonggang/chinese/work/Dat
aAnalysis/DataAnalysis-ch01.ppt
15
实验数据处理与学术道德
? http://news.xinhuanet.com/edu/2003-
02/08/content_719211.htm
? http://jiaoshi.cer.net/article/20050127/3127
925.shtml