ICS _35.240.70 L 67 GB 中华人民共和国国家标准 GB/T329092016 非结构化数据表示规范 Unstructured data expression specification 2016-08-29发布 2017-03-01实施 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T32909--2016 目 次 前言 1 范围 2 规范性引用文件 3 术语和定义 4 缩略语 5 非结构化数据DDL表示框架 5.1 概述 5.2 整体框架 5.3 基本抽象描述符 5.4 基本抽象描述方案 5.5 根元素 6 数据类型 6.1基本数据类型 6.1.1 数值数据类型 6.1,2 字符串数据类型 6.1.3 日期数据类型 6.2扩展数据类型 6.2.1 标量 10 6.2.2 向量 6.2.3 矩阵, 7基本属性措述· 13 7.1 基本元素 13 7.1.1 唯一标识符描述符 13 7.1.2 时间描述方案 13 7.1.3 人物描述符 7.1.4 地点描述方案 14 7.2 创建信息描述方案 14 7.3 修改信息措述方案 7.4 格式与大小措述方案 7.5 数据定位措述符 16 8语义特征措述 8.1 对象描述方案 16 8.2 事件描述方案 8.3 概念描述方案 8.4 数据编码描述方案 8.5 数据语义描述方案 GB/T 32909-2016 9底层特征指述 19 9.1 图像类型 19 9.1.1 颜色相关描述符 19 9.1.2纹理特征 25 9.1.3 形状特征 26 9,1,4 局部特征 27 9.2 音频类型 28 9.2.1 标量序列 28 9.2.2 低级音频指述符 30 9.2.3 静音描述符 32 9.2.4 MFCC特征描述符... 32 9.3视频类型** 33 9.3.1 时间域特征描述类型 33 9.3.2 运动特征 35 9.3.3 镜头和关键顿描述符 38 9.4文本类型 39 10 原始数据描述 40 11 关联描述符 41 11.1语义特征-底层特征关联描述符 11.2基本属性-原始数据关联描述符 11.3语义特征-原始数据关联描述符 42 11.4底层特征-原始数据关联描述符 42 附录A(规范性附录) Unsigned类型语法定义 43 附录B(资料性附录)非结构化数据表示XMLSchema定义 学兔兔ww.bzfxw.com GB/T 329092016 前言 本标准按照GB/T1.1-2009给出的规则起草 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:北京航空航天大学、中国电子技术标准化研究院、清华大学、浙江大学、中国人民 大学。 本标准主要起草人,马殿富、郎波、黄雷、高林、吴新松、刘贤刚、卫凤林、李莹、张展新、王朝坤、王建民 陈俊、庄越挺、陈岭、邵健、孙建伶、杜小勇、陈晋川。 学兔兔wwf.bzfxw.com GB/T 32909—2016 非结构化数据表示规范 1范围 本标准规定了文本、音频、视频、图像等非结构化数据的统一数据表示。 本标准适用于非结构化管理系统中非结构化数据的表示。 2规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T18793一2002信息技术可扩展置标语言(XML)1.0 XMLSchema可扩展置标语言模式(XMLSchema,W3CRecommendation,2May2001) 3术语和定义 下列术语和定义适用于本文件。 3.1 特征 Efeature 数据的特性。 3.2 逆向文件频率 inverse document frequency;IDF 个词语普遍重要性的度量,由总文件数目除以包含该词语的文件数目,将得到的商取对数获得。 3.3 词频 termfrequencyTF 某一给定的词语在文件中出现的次数。 4缩略语 下列缩略语适用于本文件。 D:描述符(Descriptor) DDL:描述定义语言(DescriptionDefinitionLanguage) DS:描述方案(DescriptionScheme) IDF:逆向文件频率(InverseDocumentFrequency) GPS:全球定位系统(GlobalPositioningSystem) MFCC:梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient) SIFT:尺度不变特征转换(Scale-InvariantFeatureTransform) TF:词频(TermFrequency) TF-IDF:词频-逆向文件频率(TermFrequency-InverseDocumentFrequency) UML:统一建模语言(UnifiedModelingLanguage) 学兔兔www.bzfxw.com GB/T 329092016 5非结构化数据DDL表示框架 5.1概述 本标准通过抽象类定义的方式,用XMLSchema来表达非结构化数据DDL表示框架,XMLSchema 的语法及使用方式见GB/T18793-2002和XMLSchema。非结构化数据表示XMLSchema定义见附录B。 5.2整体框架 非结构化数据表示的UML类图如图1所示。 Basetype DType DSType BasicAttnibutionDSType DTyp DTpe VisniDTyps AukdioDType TexIDTy 图1标准整体框架UML类图 本标准定义了BaseType、DType、DSType,BasicAttributionDSType,SemanticDSTypeLowFea- tureDSType.RawDataDSType,AssociatioDType,BasicAttributionDType,SemanticDType,LowFea- tureDType.RawDataDType,VisualDType,AudioDType,TextDType,VisualDSType,AudioDSType 和TextDSType共18个抽象类。具体各抽象类的含义如下: a)BaseType是基准类型; b)DType是抽象的描述符类型,是所有描述符的超类; c) DSType是抽象的措述方案类型,是所有措述方案的超类; (P BasicAttributionDSType是基本属性的描述方案基准类型; e) SemanticDSType是语义特征的措述方案基准类型; f) LowFeatureDSType是底层特征的描述方案基准类型; g) RawDataDSType是原始数据的措述方案基准类型; h) AssociatioDType用于描述基本属性、语义特征、底层特征和原始数据之间的关联关系; i) BasicAttributionDType是基本属性的描述符基准类型; j) SemanticDType是语义特征的描述符基准类型; k) LowFeatureDType是底层特征的描述符基类型; 1) RawDataDType是原始数据的描述符基准类型; m) VisualDSType是图像或视频类数据对其中的图像部分进行操作提取的描述方案基准类型; 2 学兔兔www.bzfxw.com GB/T32909-2016 ) AudioDSType是音频相关特征指述方案基准类型; o) TextDSType是文本相关特征描述方案基准类型; p) VisualDType是图像或视频类数据对其中的图像部分进行操作提取的描述符基准类型; (b AudioDType是音频相关特征描述符基准类型; TextDType是文本相关特征描述符基准类型。 其中BaseType的语法形式定义如下: <complexContent> <restrictionbase=-"anyType"/> </complexContent> </complexType> DType的语法形式定义如下: -<complexContent> <extensionbase="BaseType"/> </complexContent> </complexType> DSType的语法形式定义如下: <complexContent> <extensionbase="BaseType"/> </complexContent> </complexType> 5.3 基本抽象描述符 非结构化数据基本抽象描述符的关系如图2所示。 DType BasicAttributionDType SemanticDType LowFeatureDType RawDataDType AssociationDType VisualDType AudioDType TextDType 图2 基本抽象描述符 学兔兔ww.bzfxw.com GB/T32909—2016 基本属性描述符、语义特征描述符、底层特征描述符、原始数据措述符和关联描述符这5类基本抽 象描述符的语法定义如下: <complexTypename="BasicAttributionDType"abstract="true"> -<complexContent> <extensionbase="DType"/> </complexContent> </complexType> -<complexTypename="SemanticDType"abstra
GB-T 32909-2016非结构化数据表示规范
文档预览
中文文档
55 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共55页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2023-01-15 17:30:13上传分享