ICS 35.240.15 CCS L 72 中华人民共和国国家标准 GB/T 33767.14—2023 信息技术 生物特征样本质量 第14部分:DNA数据 Information technology-Biometric sample quality- Part 14: DNA data 2023-10-01实施 2023-03-17发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T33767.14—2023 目 次 前言 引言 1 范围 2 规范性引用文件 3术语和定义 缩略语 4 DNA数据类型· 5 5.1DNA测序数据 5.2 DNA比对数据 DNA分型数据 5.3 6DNA数据质量要求· 6.1 准确性 6.2 完备性 6.3 可追溯性 DNA数据质量测试方法 7 7.1 DNA数据质量测试工具 7.2DNA数据准确性测试方法 7.3DNA数据完备性测试方法 7.4DNA数据可溯性测试方法 参考文献 GB/T33767.14—2023 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 本文件是GB/T33767《信息技术生物特征样本质量》的第14部分。GB/T33767已经发布了以 下部分: 一第1部分:框架; 一第4部分:指纹图像数据; 一第5部分:人脸图像数据; 一第6部分:虹膜图像数据; 一第14部分:DNA数据。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:深圳华大法医科技有限公司、中国电子技术标准化研究院、华南理工大学、山西医 技有限公司、清华大学、上海国际人类表型组研究院、福州数据技术研究院有限公司、福建省公安厅刑事 技术总队、广东省公安厅刑事技术中心、临汾市公安局、中船重工信息科技有限公司、武汉益鼎天养生物 科技有限公司广州广电运通金融电子股份有限公司。 本文件主要起草人:高升杰、程多福、杜红丽、耿力、刘倩颖、王文峰、赖江华、吴昊、宋继伟、张洪波、 严江伟、沈悦生、李泽琴、张奕、苏立伟、钟陈、丁国徽、郭云峰、张蕾、汪小我、阳明霞、李栋、李海燕、黄建春、 李倩一、魏曙光、龚疏影、沈鹤霄、张玮、穆豪放、李宁、姜华艳、陈卫彬、郭小森、尹烨。 GB/T33767.14—2023 引言 GB/T33767《信息技术生物特征样本质量》旨在规定生物特征识别数据的样本质量要求和测试 方法,拟由十五个部分构成。 第1部分:框架。目的在于规定用于生物特征识别或验证技术的图像数据的样本质量要求和 测试方法通用框架。 第2部分:指纹细节点数据。目的在于规定基于细节点的指纹用于指纹识别或验证技术的图 像数据的样本质量要求和测试方法。 一第3部分:指纹型谱数据。目的在于规定基于指纹型谱用于指纹识别或验证技术的图像数据 的样本质量要求和测试方法。 一第4部分:指纹图像数据。目的在于规定基于指纹图像用于指纹识别或验证技术的图像数据 的样本质量要求和测试方法。 第5部分:人脸图像数据。目的在于规定基于人脸图像用于人脸识别或验证技术的图像数据 的样本质量要求和测试方法。 第6部分:虹膜图像数据。目的在于规定基于虹膜图像用于虹膜识别或验证技术的图像数据 的样本质量要求和测试方法。 第7部分:签名/签字时间序列数据,的在于规定基于签名/签字信息用于签名/签字识别或 验证技术的数据的样本质量要求和测试方法。 第8部分:指纹骨架数据。目的在于规定基于指纹骨架模式用于指纹骨架识别或验证技术的 图像数据的样本质量要求和测试方法。 第9部分:血管图像数据。目的在于规定基于血管图像用于血管识别或验证技术的图像数据 的样本质量要求和测试方法。 第10部分:手形轮廓数据。目的在于规定基于手形轮廓图像用于手形识别或验证技术的图像 数据的样本质量要求和测试方法。 第11部分:签名/签字处理的动态数据。目的在于规定基于处理后的签名/标志行为数据用于 签名/签字识别或验证技术的数据的样本质量要求和测试方法。 一第12部分:脸型特性数据。目的在于规定基于脸型特性数据用于人脸识别或验证技术的图像 数据的样本质量要求和测试方法。 第13部分:声纹数据。目的在于规定基于单个会话中记录的单个扬声器的人的声纹数据用于 说话人识别或验证技术的数据的样本质量要求和测试方法。 第14部分:DNA数据。目的在于规定基于高通量测序产生的各种DNA数据类型的DNA数 据用于DNA识别或验证技术的数据的样本质量要求和测试方法。 第15部分:掌纹图像数据。目的在于规定基于掌纹图像数据用于掌纹识别或验证技术的图像 数据的样本质量要求和测试方法。 IV GB/T33767.14—2023 信息技术生物特征样本质量 第14部分:DNA数据 1范围 本文件提出了在生物特征识别中高通量测序产生的DNA数据类型,规定了DNA数据质量要求以 及对应的DNA数据质量测试方法。 本文件适用于生物特征识别中高通量测序产生DNA数据的质量评价。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。 GB/T35890—2018高通量测序数据序列格式规范 YY/T1723—2020高通量基因测序仪 3术语和定义 3 下列术语和定义适用于本文件。 3.1 高通量测序high-throughputsequencing 区别于传统Sanger(双脱氧法)测序,能够一次并行对大量核酸分子进行平行序列测定的技术, 注:通常一次测序反应能产出不低于100Mb的测序数据。 [来源:GB/T30989—2014,3.19,有修改 3.2 DNA分型DNAgenotyping 利用生物学检测方法测定个体DNA序列,并将其与参考DNA序列进行比对,以确定该个体基因 型的过程。 3.3 数据质量dataquality 在指定条件下使用时,数据的特性满足明确的和隐含的要求程度。 [来源:GB/T36344—2018,2.3] 3.4 DNA数据 DNAdata 高通量测序后得到的原始数据、信息分析过程中的比对数据和DNA分型数据。 3.5 核酸序列 Jnucleic acid sequence 核酸的一级结构,使用一串字母表示的携带基因信息的DNA分子的一级结构。 1 GB/T 33767.14—2023 3.6 FASTQ格式FASTQformat 基于文本的、保存生物序列(通常是核酸序列)和其测序质量信息的、每四行表示一条序列的标准 格式。 [来源:GB/T35890—2018,3.9,有修改] 3.7 碱基识别base calling 测序过程中从荧光信号或其他测序反应产生的信号转换成碱基序列信息的过程。 3.8 碱基质量值 basequalityscore 碱基识别出错的概率的整数映射,用来衡量碱基正确识别的概率。 注:通常以数字值直接表示。 3.9 测序片段 reads 高通量测序平台产生的含有碱基序列和质量值的序列片段。 来源:GB/T358902018,3.2 3.10 读长 readlength 高通量测序仪单次测序所得到的平均碱基序列长度。 3.11 覆盖度 coverage ratio 测序序列与参考序列比对时,所有比对成功的区域占参考序列总区域的百分比。 3.12 序列比对 sequence alignment 比较两个或两个以上核酸序列间的相似性的过程。 [来源:GB/T29859—2013,2.2.1,有修改] 3.13 参考序列 测序片段对应的物种基因组序列。 [来源:GB/T35890—2018,3.11] 3.14 短串联重复序列 short tandem repeat 染色体上重复单位为2bp6bp的串联重复序列,表现出高度的个体差异。 来源:GB/T26237.142019,4.101 3.15 单核苷酸多态性 single nucleotidepolymorphism 由单个核苷酸改变所引起的脱氧核糖核酸序列多态性。 [来源:GB/T298592013,2.2.33,有修改] 3.16 目标区域 targetregion 包含目标短串联重复序列或单核苷酸多态性位点的基因组区域。 2 GB/T33767.14—2023 3.17 基因型genotype 个体的一个或多个基因座上等位基因的组成。 注:本文件中特指SNP或STR位点的等位基因组成。 3.18 测序深度sequencingdepth 测序样本中目标区域核苷酸被检测到的次数。 3.19 测序芯片 sequencingchip;flowcell 高通量测序中为待测DNA分子提供测序反应场所的容器。 注:测序芯片是高通量测序的核心部件,具有吸附移动DNA片段的通道,测序文库中的DNA片段在通过通道时 会随机附着在通道表面。 4缩略语 下列缩略语适用于本文件。 BAM:二进制比对(binaryalignmentmap) bp:碱基对(basepair) DNA:脱氧核糖核酸(deoxyribonucleicacid) MAPQ:比对质量值(mappingqualityscore) MD5:消息摘要算法第五版(message-digestalgorithm5) Q-score:碱基质量值(basequalityscore) Q30:碱基识别质量三十百分比(thepercentofbasequalitymorethan30) SAM

pdf文档 GB-T 33767.14-2023 信息技术 生物特征样本质量 第14部分:DNA数据

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 33767.14-2023 信息技术 生物特征样本质量 第14部分:DNA数据 第 1 页 GB-T 33767.14-2023 信息技术 生物特征样本质量 第14部分:DNA数据 第 2 页 GB-T 33767.14-2023 信息技术 生物特征样本质量 第14部分:DNA数据 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2023-05-01 06:49:17上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。