登陆注册
3289000000022

第22章 内容的表达和元数据(6)

4.5.1.1键—长度—值结构

KLV协议用16个字节的全局标签(Universal Label, UL)作为标识键,其后跟随给出数据值长度的数字值。键是一个全局标签,根据SMPTE 298M,开头以一个对象标识开始,紧跟着一个全局标签大小。全局标签标识以一个标识组织用的标准的编码开始,其后是SMPTE的次级标识符。接下来的字节标识符是注册的类别,如SMPTE元数据字典,6和7字节更具体地标识带有版本编号的注册和结构。在全局标签标识中,对特别条目的特殊标识由9~16字节表示。

长度部分根据基本编码规则(Basic Encoding Rules, EBR)编码。可以根据ISO标准使用长度字节的长或短的编码。数据值可以是单个数据或者数据组。

4.5.1.2KLV数据编码

单个数据的编码应用键来标识参考框架和数据类型、长度以及编码值。因为对于一个描述符有很多种字典提供了表达的方法,所以要选择用哪种方法来表示,(根据所应用的表示键)要选择一个初始的定义表示方法。备选方案在最左边字节由非零值和字典中存储的值表示。

为了支持个体数据元素的逻辑组或者使一组元素可以编码在一起,定义了分组编码方案。该编码方案可以用键单元减少冗余信息。分组编码也可以用于建立数据元素的逻辑组。KLV编码协议可以用于广义集合、全局集合、局部集合、可变长度包以及定长包。编码效率从广义集合到定长包递增,即广义集合效率最低,定长包效率最高。KLV分组编码详细介绍如下:

·广义集合,用来构建一个数据元素和其他KLV编码项目的逻辑组。在广义集合中用到了全部的KLV编码。

·全局集合,和广义集合定义方式一样,但是编码效率比广义集合要高,因为它使用共享的键头,这和原始键能够完全恢复的无压缩编码效果一样。

·局部集合,和广义集合编码方式一样,但是由于使用了简短的局部标识而有了更高的编码效率。这些标识只在局部集合中有意义,它保存了KLV数据结构的构架,但是局部标识需要有独立和具体的定义标准来定义其具体意义。同时也要定义局部标识如何映射在广义的标识键值中。

·可变长度包,用来定义为一个数据元素的深度分组(并且移除了组中所有元素的UL键和局部标识)的使用。可变长度包依赖于定义包中数据元素顺序的标准或规范。

·定长包,不仅移除了UL键和局部标识的使用,同时也去除了组中所有单个元素的长度。因此,定长包基于定义了包中数据元素的命令和每个数据元素长度的标准。这样使得定长包成为编码最有效率但也是最不灵活的数据元素编组。

集合和包是由很多KLV集合和大包数据的结构编码归组的单个数据元素组成。它们由SMPTE注册机关给予注册的广义标识键所定义。由集合编码的数据元素可能不仅仅是一个数据字典的项目,同时可能是其他包和集合的元素;而包只能编码一个数据字典中的一组单个项目,如它们不能使用循环递归编码。键的第5个字节定义了集合和包,第6字节定义了集合和包的类型。

标签是标识标签自己定义的有意义(或者值)的对象的特殊类型。因此,标签不需要长度域和值域,它们要在特殊的标签字典中被定义。

4.5.2可扩展标记语言

可扩展标记语言(eXtensible Markup Language, XML)是由W3C定义,由SGML(见3.5.2.1节)发展而来的非常灵活的文本格式。XML最初被大型电子出版业使用,现在已用于更广泛的数据范围(特别是网络)。它为数据内容定义了一个容器格式和自动验证结构,如XML描述了一个数据对象类(称为XML文档)并部分描述了计算机程序处理过程的行为。XML的设计目标是:

·在互联网上直接使用。

·支持广泛的应用。

·可以与SGML相媲美。

·优化处理XML文档的程序开发。

·最小化的可操作特征。

·XML编码文档易懂,可以方便、快速地建立。

·XML文档易被建立。

XML定义了文档建立的方式、描述了文档的结构、指定了其要包含的实体。XML文档的关键元素是标记,它以标签的方式存在,最常用的是封装文本元素的开始标签和结束标签。标签被用于结构化文档和部分文档。标签还组成实体和参数属性、描述、文档类型和XML声明,以及处理指令和内部别名。

根据标签的定义和文档类型的声明,并没有规定具体的结构,如并没有定义XML文档的具体形式、所包含元素的数量、元素的格式,以及判断一个好的XML文档的具体标准。XML1.0定义了一个文档需要包含一个或者多个元素,每个元素都由开始标签和结束标签限定。因此,它提供了一个语义框架以形成完整的能够供检索系统使用的XML文档。除了简单元素之外,XML文档还包含属性,即文档中可以赋值的实体。

如果XML文档中没有任何元素的深层定义和量化、没有元素的特征和关系、没有元素在文档中出现的次数统计以及没有给定文档结构中的指定位置,XML文档就不能被编译。因为没有参考点,所以就不能决定文档是否是完好的和有效的。另外,为了交换XML文档中的信息,有必要使所有参与的部分有着和文档内容一样的结构意义和编译方法。可以应用一个XML方案来指定XML文档元素的特征和关系以及XML文档类的属性。信息和文档的分类以及交换由具体的XML方案或者文档类型优化。这基本为特殊文档类型定义了一个框架。有很多XML方案可以用于定义XML文档类型和指定分类。最常用的是文档类型定义(Document Type Definitions, DTD)和W3C XML方案。

内容管理中重要的是不仅可以将XML应用于文档,还可以将其应用于数据流。因此,除了适合基本的文件转换以外,XML还特别适用于内容传输。

4.5.2.1文档类型定义

能够指定XML文档结构的一种形式是使用DTD。DTD是用非XML语法写成的,它描述了特定文档类型的文档结构和允许的内容。DTD基于SGML使用扩展的Bakus-Naur形式(Extended Bakus-Naur Form, EBNF)。DTD声明了XML的文档类型、元素和属性。因为它主要是定义文档的(即它的中心是文档定义而不是数据定义),所以不太支持多种数据类型。DTD只声明元素的特征数据而不指定该数据类型。因此,它不能指定数据类型的所属范围和具体元素的属性,它只给出某一个类型的文档所应该包含的结构和元素。

4.5.2.2W3C XML方案

W3C最初指定了用XML语义的XML方案,它不仅定义了XML文档和文档类型的结构,还综合了XML命名空间、结构方案、数据类型以及继承用法。W3C XML方案定义(XML Scheme Definition, XSD)的三种主要方案——XML方案第0部分:入门;XML方案第1部分:结构;XML方案第2部分:数据类型。第1部分定义了XML方案的定义语言,它用来描述XSD所定义的XML文档的结构和内容组成。第2部分描述了一些植入的、基本的数据类型(如整数、日期和二进制数据),并定义了附加数据类型用XML方案的定义语言定义的方法。XSD提供和DTD相似的元素类型声明和属性声明的机制,另外它还支持对于最大和最小出现频率的定义。

XSD和DTD最大的不同是XSD定义了数据类型列表。XSD区别了简单数据类型和推导出的数据类型。推导出的数据类型定义了由规则和列表推导出的进一步的数据类型。

除了简单数据类型,第2部分还定义了很多的推导数据类型(如规则字符串、名称、ID、长短字节等)。XSD定义的命名空间要加xsd命名空间前缀。

同类推荐
  • 教育:从自发走向自觉

    教育:从自发走向自觉

    教育是什么,教育为什么,教育工作者的使命在哪里?只有搞清这些问题,我们工作的目标、价值和意义才能更明确。糊涂的校长办糊涂的教育,自觉的校长办自觉的教育。本书是“全国优秀中学校长高级研究版”的部分成果,展现了部分优秀中学校长对教育和办教育的理解与反思。
  • 湖南人性格地图

    湖南人性格地图

    湖南人号称“南方的北方人”,性格张扬刚烈,像辣椒一样火爆,不达目的不罢休。在外地人心中,湖南人是很聪明的。无论在什么地方,在什么岗位,湖南人总是给人一种出类拔萃的印象。湖南人头脑机敏,对政治军事感兴趣,而一旦应用到经济上来,也能有所成就,湖南人的机敏是其他人比不了的。
  • 新公共管理学范式(谷臻小简·AI导读版)

    新公共管理学范式(谷臻小简·AI导读版)

    《新公共管理范式》。本理论框架以公共管理学理论前沿的基本原理与科学机制为研究对象,围绕“国家与市场”、“公平与效率”等四个核心概念和两对核心范畴,并以此原理贯通自编自选英文版公共管理学原著节选资料等教学资料,依据并结合主讲者自身相关公共管理方面的社会调查与理论研究等研究成果,特别是从公共管理学与经济学、社会学、法理学、政治学交叉结合的四个维度,讲授国际通行的公共管理学理论前沿与实践创新等课题,使同学们能够比较系统地掌握关于公共管理学的理论发展脉络和理论前沿研究的主要思想、基本理论、一般逻辑和科学方法等学科体系。……
  • 最草根生活

    最草根生活

    本书是一部反映中国平民阶层生存状态的纪实力作。以中国当代社会转型时期为时代大背景,展示了一些特殊人群的生活经历,他们身处社会底层,历经动荡曲折,遭遇种种不幸,然而他们处惊不乱,依照自己的生活态度坦然面对世态万象,作为“小人物”艰难而韧性地活在这个巨变的大世界。
  • 人口原理

    人口原理

    《人口原理》是学术史上的一部重要著作,也是出版以来社会科学领域争议最多的一部著作,它对世界人口理论以及整个社会生活的许多方面都有着广泛的影响。
热门推荐
  • 星空门

    星空门

    浩瀚的幽云大陆,古老的邢氏家族,神奇的道家门派,将上演怎样的传奇故事?当东方修真遇上西方魔法,是斗争?是妥协?还是融合?生在这乱世的刑云和启山又将要怎样去演绎自己平凡抑或华丽的人生,精彩故事,敬请期待。
  • 科幻世界·译文版(2017年6月)

    科幻世界·译文版(2017年6月)

    科幻世界杂志社创立于1979年,目前是中国最具影响力的专业科幻出版机构。其中,由四川省科协主管主办的《科幻世界》月刊,以倡导创新思维,展示科学魅力为发展目标,主要刊登国内外一流的科幻小说和最新沿的科学动态,以及优秀的科幻画作和实用的写作指南,极大地激发了青少年读者崇尚科学、热爱幻想的热情,多次荣获国内期刊出版最高奖项。
  • New Thought Pastels

    New Thought Pastels

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 夏先生的人设崩了

    夏先生的人设崩了

    清心寡欲实则狠戾无情的夏候琰,心中藏着一座无人可触碰的城。谁敢动一下,他就能跟人拼命。一、始于狗血的开始。本以为分道扬镳之后,再无交集。再次见面,“夏候先生,不好意思,借个宝贝用用。”夏候琰慢慢抬眼,良久,“乔小姐,借了怎么还?”乔天琪:……二、某日高峰座谈会上,夏霸总耳上带着蓝牙,双手捧着手机不断的输入。一众大佬看着他这个严肃冰冷的表情,以为在谈几百亿的生意,谁也不敢出声打扰。直至有人不经意的一瞥,瞬时惊掉了下颚,表情更是一言难尽。夏霸总的人设瞬间崩塌。原因无他,在谈几百亿生意的夏霸总正在怒怼乔小姐的各路老婆老公粉。三、乔小姐很缺钱,某日直播间,面无表情的喊麦:老铁们,嗨起来!鲜花游轮刷起来。瞬间屏幕被ID为乔乔老公用游轮刷满。乔小姐看着那ID:谢谢这位……呃……四、权势滔天的夏霸总眉头紧锁坐在卡座上。一众发小们为他出谋划策。原因无他,已经28“高龄”的男人想要结婚想疯了。奈何他那位钟情于演戏的乔影后却丝毫没有结婚的打算。这是一个甜宠的故事,双洁,从校园到婚纱。
  • 法恩男爵战纪

    法恩男爵战纪

    震惊!南达克公国的某不愿透露姓名的法恩男爵竟做出这种丧心病狂的事情来!这究竟是人性的扭曲还是道德的沦丧?详情请关注本书。(萌新开书,若内容有严重错误的地方,还请各位大佬加以指正)
  • 最佳恋爱对象

    最佳恋爱对象

    现代版的灰姑娘,一个从小就让别人说成不是父母亲生的女孩,在经历过了风风雨雨,看她怎样克服困难。最终嫁入豪门。青春美好,恋爱趁早。这里有豪门恩怨,这里有青春校园,这里有现实生活,这里有欢乐有泪水,人性善恶,勾心斗角。
  • 望台娇

    望台娇

    嫡母刻薄,生母懦弱,在众美女姐妹中最不起眼的‘丑女’,没有关系!!被老爹忽略,嫡母不喜,姐姐妹妹鄙视中,连丫鬟都看不起她,真的没关系。她这一生,经历曲折,堪称惊心动魄,在这礼教严谨的古代,硬生生的被她老爹和嫡母嫁了三次,夫家一个比一个有权势。一嫁定远大将军,还没圆房,丈夫死翘翘了,被冠上克夫的恶名送回了娘家!二嫁冷面美丞相,还米有弄清楚嫁的何许人也,新婚第二天,一纸休书把她休回了娘家,只因为她长得丑!!三嫁花心风流武皇帝,结果女主害怕深宫锁玉,折磨不休的生活,没志气的投水自尽了,然后某人华丽丽的穿来了。。。重生的柳湘颜看着镜子里自己占据的倒霉的原主人身体,无奈的叹口气,很是搞不懂,明明不是倾国倾城的美人,为什么每一次嫁的男人越来越显赫呢?好吧,既穿之则安之,人不犯我,相安无事,人若犯我。。。逃跑了事。。。不过,若是逃不过,嘿嘿。。。也别当我是好捏的软柿子~~~老坑链接:本文的姐妹篇杜月城的故事《妻妾斗:正妻不下堂》连续两月位居月票榜第二!
  • 另从驱魔开始

    另从驱魔开始

    王玄业被不靠谱的师父赶下山,意外地发现降妖除魔居然可以获得来自天道的丰厚奖赏,修炼的速度大幅度提升。精彩的人生自此拉开帷幕……
  • 穿越从路易十三时代开始

    穿越从路易十三时代开始

    喜欢五百废的历史读者看过来,新的五百废出现了。一切从一场有组织的到十七世纪初欧洲的穿越试炼开始。对于优秀的赵红军和他的三个兄弟而言,航海探险可以有,征服世界也可以有,然而前提是通过五百名额的试炼……首先,他面临的问题是……他是个文科生,而且马上要被抄家了。“在十七世纪打警察犯不犯法呢?”赵红军。
  • 墨哥哥别丢下我

    墨哥哥别丢下我

    刻小说讲述了方易欢和青梅竹马的王千墨、程昊三人的青春浪漫、伤感故事。