ICS 03. 120.30 A41 中华人民共和国国家标准 GB/T 8056—2008 代替GB/T8056—1987 数据的统计处理和解释 指数分布样本离群值的判断和处理 Statistical interpretation of dataDetection and treatment of outliers in the sample from exponential distribution 2009-01-01实施 2008-07-16发布 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T8056—2008 目 次 前言 引言 1 范围 2 规范性引用文件 3 术语、定义和符号: 3.1术语和定义 3.2符号和缩略语 4离群值判断 4.1 离群值的来源与判定 4.2 离群值的三种情形 4.3 检出离群值个数的上限 4. 4 单个离群值情形 4. 5 多个离群值情形 5 离群值处理 5. 1 处理方式 5. 2 处理规则 5.3 备案 6 单个离群值的判断规则 6. 1 检验统计量的选择 6.2 上侧情形的检验规则 6.3 下侧情形的检验规则 6.4 双侧情形的检验规则 7 多个离群值的判断规则 7. 1 检验步骤 7.2多个离群值检验示例 8定数截尾样本离群值的判断规则 8.1定数截尾样本 8.2离群值的检验规则 8.3定数截尾样本离群值检验示例 附录A(规范性附录)临界值表 参考文献 15 GB/T 8056—2008 前言 本标准代替GB/T8056一1987《数据的统计处理和解释指数样本异常值的判断和处理》。本标 准与GB/T8056—1987相比较,技术内容的变化主要包括: 增加了术语、定义和符号; 将“指数样本异常值的判断和处理”改为“指数样本离群值的判断和处理”; 一将术语“检出异常值”和“高度异常值”分别改为“歧离值”和“统计离群值”,并进一步明确了二 者的含义及相互差异; 一增加了检出水平和剔除水平的定义; 各方另有约定,检出水平应为0.05”; 明确规定剔除水平的值除非根据本标准达成协议的各方另有约定,剔除水平应为0.01; 增加了各种情形“统计离群值”的检验步骤; 将“没有异常值”和“没有高度异常的异常值”分别改为“未发现离群值”和“未发现统计离群 值”; 一 增加了双侧离群值检验、多个离群值检验、定数截尾样本离群值检验的示例。 本标准的附录A是规范性附录。 本标准由全国统计方法应用标准化技术委员会提出并归口。 本标准起草单位:宁波工程学院、中国标准化研究院、北京大学、上海师范天学、福州春伦茶业有限 公司。 本标准主要起草人:荆广珠、丁文兴、于振凡、梁方楚、孙山泽、费鹤良、傅天龙 本标准所代替标准的历次版本发布情况为: GB/T8056—1987。 GB/T8056—2008 引言 从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不 开统计方法。统计学是研究数字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取 得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计 方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出 来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。 《数据的统计处理和解释》含有多项国家标准,它们是: 统计容忍区间的确定(GB/T3359) 均值的估计和置信区间(GB/T3360) 在成对观测值情形下两个均值的比较(GB/T3361) 二项分布参数的估计与检验(GB/T4088) 泊松分布参数的估计与检验(GB/T4089) 正态性检验(GB/T4882) 正态样本离群值的判断和处理(GB/T4883) 正态分布均值和方差的估计与检验(GB/T4889) 正态分布均值和方差检验的功效(GB/T4890) I型极值分布样本离群值的判断和处理(GB/T6380) 伽玛分布(皮尔逊Ⅲ型分布)的参数估计(GB/T8055) 指数分布样本离群值的判断和处理(GB/T8056) 本标准尚无相应的国际标准。 1 GB/T 8056—2008 数据的统计处理和解释 指数分布样本离群值的判断和处理 1范围 本标准规定了判断和处理来自指数分布的样本中离群值的一般原则和实施步骤。 本标准适用于来自指数总体的样本 2规范性引用文件 下列文件中的条款通过本标准引用成为本标准的条款。凡是注日期的引用文件,其随后所有的修 改单(不包括勘误的内容)或修订版本均不适于本标准。然而,鼓励根据本标准达成协议的各方研究是 否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T4086.4统计分布数值表F分布分位数表 ISO3534-1统计学词汇及符号第1部分:一般统计术语与用于概率的术语 ISO3534-2统计学词汇及符号第2部分:应用统计 3术语、定义和符号 ISO3534-1、ISO3534-2确立的术语、定义和符号以及下列术语、定义和符号适用于本标准。为便 于参考,某些术语直接引自上述标准。 3.1术语和定义 3. 1. 1 指数分布 exponential distribution 具有下述分布函数的连续型分布, [1-e-r/β,r>0 F(α) 0. 其中β>0。 3. 1. 2 离群值outlier 样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。 注:离群值按显著性的程度分为歧离值和统计离群值 3.1.3 统计离群值 statistical outlier 在剔除水平(3.1.6)下统计检验为显著的离群值。 3. 1. 4 歧离值straggler 在检出水平(3.1.5)下统计检验为显著,但在剔除水平(3.1.6)下不显著的离群值 3. 1.5 检出水平detectionlevel 为检出离群值而指定的统计检验的显著性水平 注:除非根据本标准达成协议的各方另有约定,检出水平应为0.05。 1

pdf文档 GB-T 8056-2008 数据的统计处理和解释 指数分布样本离群值的判断和处理

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 8056-2008 数据的统计处理和解释  指数分布样本离群值的判断和处理 第 1 页 GB-T 8056-2008 数据的统计处理和解释  指数分布样本离群值的判断和处理 第 2 页 GB-T 8056-2008 数据的统计处理和解释  指数分布样本离群值的判断和处理 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-02-24 10:17:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。