ICS 03.120.30 A 41 中华人民共和国国家标准 GB/T 6380—2019 代替GB/T6380—2008 数据的统计处理和解释 工型极值分布样本离群值的判断和处理 Statistical interpretation of dataDetection and treatment of outliers in the sample from type I extreme value distribution 2020-07-01实施 2019-12-10发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T 6380—2019 目 次 前言 引言 1 范围 2 规范性引用文件 3术语、定义和符号 3.1 术语和定义 3.2 符号 离群值判断 4.1 离群值的来源与判定 4.2 检出离群值个数的上限 4.3 单个离群值情形 4.4 多个离群值情形 5离群值处理 5.1 处理方式 5.2 处理规则 5.3 备案 6单个离群值的判断规则 6.1检验方法的选择 6.2狄克逊(Dixon)检验法 6.3欧文(Irwin)检验法 7多个离群值的判断规则 7.1检验步骤 7.2多个离群值检验示例 附录A(规范性附录) 狄克逊检验的临界值表 附录B(规范性附录) 欧文检验的临界值表 参考文献 GB/T 6380—2019 前言 本标准按照GB/T1.1—2009给出的规则起草 本标准代替GB/T6380—2008《数据的统计处理和解释 I型极值分布样本异常值的判断和处 理》,与GB/T6380一2008相比,主要技术内容变化如下: 修改了术语I型极值分布(见3.1.1,2008年版的3.1.1); 修改了术语I型极小值分布(见3.1.22008年版的3.1.2); 修改了术语离群值(见3.1.3,2008年版的3.1.3); —增加了次序统计量的定义及说明(见3.1.8); 修改了离群值的处理规则(见5.2,2008年版的5.2); 增加了威布尔分布(Ⅲ型极小值分布)取对数后转化为I型极小值分布的说明及离群值计算示 例(见6.2.3); 增加了参考文献ISO16269-4:2010(见参考文献)。 本标准由全国统计方法应用标准化技术委员会(SAC/TC21)提出并归口。 本标准起草单位:天津大学、北京理工大学珠海学院、宁波工程学院 本标准主要起草人:马逢时、许其州、史道济、荆广珠。 本标准所代替标准的历次版本发布情况为: GB/T63801986,GB/T63802008 1 GB/T6380—2019 引言 从事科学研究,工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不 开统计方法。统计学是研究数字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取 得各种数字资料,这些数字资料通常都是杂乱无章的,经过整理和简缩才能利用,使用完善的统计方法 就可使数据整理、排列得有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出来,这 样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。 根据收集到的样本观测值,可以大体上确认样本来自为某种分布。这时发现样本中的一个或几个 观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。是否为实际的离群值,需要统计检 验。在离群值的检验中特别要注意数据来自哪一种基本分布,假定来自1型极值分布与假定来自正态 分布在检验时是非常不同的,对分布的错误假定会导致观测值被错误地归类为离群值 国家标准《数据的统计处理和解释》包含以下各项: 统计容忍区间的确定(GB/T3359); 均值的估计和置信区间(GB/T3360); 在成对观测值情形下两个均值的比较(GB/T3361); 二项分布参数的估计与检验(GB/T4088); 泊松分布参数的估计与检验(GB/T4089); 正态性检验(GB/T4882); 正态样本离群值的判断和处理(GB/T4883); 正态分布均值和方差的估计与检验(GB/T4889); 正态分布均值和方差检验的功效(GB/T4890); 一I型极值分布样本离群值的判断和处理(GB/T6380); -T分布(皮尔逊Ⅲ型分布)的参数估计(GB/T8055); 指数样本离群值的判断和处理(GB/T8056)。 Ⅱ GB/T 6380—2019 数据的统计处理和解释 工型极值分布样本离群值的判断和处理 1范围 本标准规定了判断和处理I型极值分布的样本中的上侧离群值和I型极小值分布的样本中的下侧 离群值的一般原则和实施方法。 本标准适用于来自I型极值分布或I型极小值分布总体的样本,以及样本量为5~50的情形。 注1:由于经过变换Y一X后,I型极小值分布的随机变量将服从I型极值分布,所以只对I型极值分布给出检 出上侧离群值的方法。 注2:由于Ⅲ型极小值分布(威布尔分布)经过对数变换Z=lnX后将服从I型极小值分布,所以本标准实际上对Ⅲ 型极小值分布(威布尔分布)给出检出下侧离群值的方法。 注3:I型极值分布在水文、气象、地震、可靠性以及金融等很多领域有着广泛的应用。 2规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T3358.1统计学词汇及符号第1部分:一般统计术语与用于概率的术语 GB/T3358.2统计学词汇及符号第2部分:应用统计 3术语、定义和符号 3.1术语和定义 GB/T3358.1和GB/T3358.2界定的以及下列术语和定义适用于本文件。 3.1.1 I型极值分布typeIextremevaluedistribution 具有下述分布函数 F(α) =exp(-e-(r-α)/b) 的连续型分布,其中b>0,一<a<8, 8>r>8 注1:当a=0.b=1时,I型极值分布的概率密度函数曲线图见图1。 +f(s) 0. 40 0. 30 0. 20 0. 10 0.00 2 -1 0 2 4 9 图1概率密度函数曲线图 1

pdf文档 GB-T 6380-2019 数据的统计处理和解释 Ⅰ型极值分布样本离群值的判断和处理

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 6380-2019 数据的统计处理和解释  Ⅰ型极值分布样本离群值的判断和处理 第 1 页 GB-T 6380-2019 数据的统计处理和解释  Ⅰ型极值分布样本离群值的判断和处理 第 2 页 GB-T 6380-2019 数据的统计处理和解释  Ⅰ型极值分布样本离群值的判断和处理 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-02-01 17:30:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。