ICS35.240.15 CCS L 73 中华人民共和国国家标准 GB/T 42751—2023 信息技术 生物特征识别 高通量测序基因分型系统规范 Information technologyBiometricSpecification for high-throughput sequencing genotyping system 2023-12-01实施 2023-05-23发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T 42751—2023 目 次 前言 1 范围 规范性引用文件 术语和定义 缩略语 5 -般要求 5.1 通则 5.2 工作流程 5.3 功能要求 5.4 性能要求 5.5 信息安全要求 测试方法 6 6.1 测试环境 6.2 测试用标准样本 6.3 测试项目 附录A(资料性) 测试记录示例 参考文献 GB/T42751—2023 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:深圳华大法医科技有限公司、中国电子技术标准化研究院、山西医科大学、西安交 通大学、华南理工大学、深圳华大基因股份有限公司、上海国际人类表型组研究院、深圳华大基因科技有 技术总队、广东省公安厅刑事技术中心、临汾市公安局、武汉益鼎天养生物科技有限公司、北京中科虹霸 科技有限公司。 本文件主要起草人:高升杰、杨建军、严江伟、耿力、刘倩颖、王文峰、赖江华、沈悦生、宋继伟、 张洪波、杜红丽、郭云峰、吴昊、李泽琴、张奕、丁国徽、苏立伟、钟陈、张蕾、汪小我、李博文、王秋娟、 李海燕、黄建春、段晋琦、沈鹤霄、李星光、魏曙光、康恒亮、穆豪放、姜华艳、郭小森、尹烨。 GB/T42751—2023 信息技术生物特征识别 高通量测序基因分型系统规范 1范围 本文件规定了基于高通量测序的基因分型系统的组成、功能要求、性能要求、信息安全要求及测试 方法。 本文件适用于基于高通量测序的基因分型系统的设计、研发、测试及使用。 2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 本文件。 GB/T22239信息安全技术网络安全等级保护基本要求 GB/T33767.14—2023信息技术生物特征样本质量第14部分:DNA数据 GB/T37223亲权鉴定技术规范 GB/T41806信息安全技术基因识别数据安全要求 SF/ZJD0105012—2018个体识别技术规范 YY/T1723—2020高通量基因测序仪 术语和定义 3 SF/ZJD0105012—2018和YY/T1723—2020界定的以及下列术语和定义适用于本文件。 3.1 高通量测序 high-throughputsequencing 能够一次并行对大量核酸分子进行平行序列测定的技术,通常一次测序反应能产生不低于100M 碱基对的测序数据。 [来源:GB/T30989—2014,3.19,有修改] 3.2 测序通量 sequencing throughput 测序仪单次测序可获得的序列数量 [来源:GB/T35537—2017,3.1.3,有修改] 3.3 基因座locus 染色体上基因所占的位置或基因组DNA中的一段。 [来源:GA/T1694—2020.3.1] 3.4 等位基因 allele 位于一对同源染色体的相同位置上控制同一性状的不同形式的基因。 1 GB/T42751—2023 [来源:GA/T1694—2020,3.2]] 3.5 基因型 genotype 个体一个或多个基因座上等位基因的组成。 注:本文件中特指SNP或STR基因座的等位基因组成 3.6 纯净数据 clean data 去除原始数据中低质量碱基和接头序列的数据。 3.7 基因型分析 genotype calling 利用数据分析和处理方法测定个体基因型的技术。 3.8 测序深度 depth of sequencing 测序样本中某个指定核酸分子被检测到的次数。 [来源:GB/T30989—2018,3.31,有修改] 3.9 测序片段 reads 高通量测序平台产生的含有碱基序列和质量值的序列片段。 [来源:GB/T35890—2018,3.2] 3.10 目标参考序列 1 target reference sequence 用于测序片段比对的基因组目标区域序列。 4缩略语 下列缩略语适用于本文件。 CPE:累积排除概率(cumulativepowerofexclusion) CPI:累积亲权指数(combinedpaternityindex) DNA:脱氧核糖核酸(deoxyribonucleicacid) LR:似然率(likelihood ratio) SNP:单核苷酸多态性(singlenucleotidepolymorphism) STR:短串联重复序列(shorttandem repeats) 5 一般要求 5.1 1通则 高通量测序基因分型系统是通过高通量测序技术确定个体基因型,用于生物特征识别的分析系统 应包含高通量测序仪、服务器计算机等硬件设备,以及具有序列比对、个体识别和亲权鉴定等人类基因 组识别功能的应用软件。 5.2 工作流程 高通量测序基因分型系统工作流程是: a)7 高通量测序仪测序得到原始数据; 2 GB/T42751—2023 b)对原始数据进行质量分析和预处理得到纯净数据; 将纯净数据与目标参考序列比对生成序列比对结果数据; ) 分析比对结果数据生成样本基因型数据; e) 对基因型数据进行质量判断,通过质量判断的基因型数据与已知基因型的目标样本之间进行 基因型比对,得到比对结果; f 根据比对结果给出个体识别或亲权鉴定的结果,并输出相应的报告。 高通量测序基因分型系统工作流程示意图如图1所示。 高通量测序基因分型系统 测序 【文库制备】 服务器 原始数据 不符合 数据量检测 质量判断 符合 高通量 测厅仪 原始数据 准确性检测 预处理 纯净数据 完各性检测 序列比对 基因型数据 准确性检测 质量判断 基内型 基因型 序列比对 / 判断 完备性检测 数据 分析 数据 不符合 符合 可溯性检测 亲权鉴定 亲权鉴定:CPT们 计算,CPE值计算 结果报告 个体识别 个体识别:LR值 计算,校止I.R值计算 结果报告 图1高通量测序基因分型系统工作流程示意图 5.3功能要求 5.3.1总体要求 高通量测序基因分型系统应具备高通量测序功能、原始数据质量分析功能、预处理功能、序列比对 功能、基因型分析功能、基因型数据质量判断功能、个体识别功能和亲权鉴定功能。 5.3.2高通量测序功能 应能利用高通量测序仪对检测样本的测序文库进行序列测定并生成原始数据,原始数据格式应符 合GB/T33767.14一2023中5.1的要求。 5.3.3原始数据质量分析功能 5.3.3.1应能对高通量测序原始数据的数据量、数据质量和完备性进行统计分析。 5.3.3.2应根据GB/T33767.14一2023中6.2.1、6.3.1和6.4.2的要求对原始数据检测结果进行判 断,满足全部要求则判定为符合质量要求,否则判定为不符合质量要求。 3 GB/T42751—2023 5.3.4预处理功能 5.3.4.1应能将符合质量要求的原始数据转化为纯净数据。 5.3.4.2纯净数据的文件格式应符合GB/T33767.14一2023中5.1的要求,且不应包含测序建库接头 序列。 注:接头序列是一段已知的短核苷酸序列,用于连接未知的目标测序片段。 5.3.5序列比对功能 5.3.5.1应能将预处理后的纯净数据与目标参考序列比对,生成序列比对数据。 5.3.5.2序列比对数据的格式应符合GB/T33767.14一2023中5.2的要求。 5.3.6基因型分析功能 5.3.6.1J 应能将序列比对数据转化为基因型数据。 5.3.7基因型数据质量判断功能 5.3.7.1J 应能对序列比对结果分析产生的基因型数据的准确性、完备性和可溯性等指标进行统计分析。 5.3.7.2应根据GB/T33767.14一2023中6.2.3、6.3.3和6.4.4的要求对序列比对结果分析产生的基因 型数据进行判断,满足全部要求则判定为符合质量要求,否则判定为不符合质量要求。 5.3.8个体识别功能 5.3.8.1应能对符合质量要求的基因型数据与目标样本的已知基因型数据进行基因型比对,并进行一 致性判断。 的公式计算LR。当测序样本基因型与目标样本基因型不一致时,应导人突变罚分机制。每有一个不 一致的基因对LR罚分1X10-8,将罚分后的LR称为校正似然率。即校正似然率=LRX a) 当校正似然率1×10时,表明有足够的证据支持测序样本与自标样本的DNA来源于同一 个体; b) 当校正似然率<1时,表明有足够的证据支持测序样本与目标样本的DNA来源于不同个体; 当1≤校正似然率<1X101°时,表明没有足够的证据支持测序样本与目标样本DNA是否来 源于同一个体; d) 系统不应出现1≤校正似然率<1×101°的结果。 5.3.9亲权鉴定功能 5.3.9.1 应能对测序样本的基因型数据与目标样本的已知基因型数据进行亲权鉴定。 5.3.9.2J 应能根据GB/T37223计算CPE和CPI,并给出亲权鉴定结果: b) 当CPE≥0.9999并且CPI<10-4,判定没有亲权关系:; c) 当CP

pdf文档 GB-T 42751-2023 信息技术 生物特征识别 高通量测序基因分型系统规范

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 42751-2023 信息技术 生物特征识别 高通量测序基因分型系统规范 第 1 页 GB-T 42751-2023 信息技术 生物特征识别 高通量测序基因分型系统规范 第 2 页 GB-T 42751-2023 信息技术 生物特征识别 高通量测序基因分型系统规范 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-06-17 21:30:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。