登陆注册
3289000000022

第22章 内容的表达和元数据(6)

4.5.1.1键—长度—值结构

KLV协议用16个字节的全局标签(Universal Label, UL)作为标识键,其后跟随给出数据值长度的数字值。键是一个全局标签,根据SMPTE 298M,开头以一个对象标识开始,紧跟着一个全局标签大小。全局标签标识以一个标识组织用的标准的编码开始,其后是SMPTE的次级标识符。接下来的字节标识符是注册的类别,如SMPTE元数据字典,6和7字节更具体地标识带有版本编号的注册和结构。在全局标签标识中,对特别条目的特殊标识由9~16字节表示。

长度部分根据基本编码规则(Basic Encoding Rules, EBR)编码。可以根据ISO标准使用长度字节的长或短的编码。数据值可以是单个数据或者数据组。

4.5.1.2KLV数据编码

单个数据的编码应用键来标识参考框架和数据类型、长度以及编码值。因为对于一个描述符有很多种字典提供了表达的方法,所以要选择用哪种方法来表示,(根据所应用的表示键)要选择一个初始的定义表示方法。备选方案在最左边字节由非零值和字典中存储的值表示。

为了支持个体数据元素的逻辑组或者使一组元素可以编码在一起,定义了分组编码方案。该编码方案可以用键单元减少冗余信息。分组编码也可以用于建立数据元素的逻辑组。KLV编码协议可以用于广义集合、全局集合、局部集合、可变长度包以及定长包。编码效率从广义集合到定长包递增,即广义集合效率最低,定长包效率最高。KLV分组编码详细介绍如下:

·广义集合,用来构建一个数据元素和其他KLV编码项目的逻辑组。在广义集合中用到了全部的KLV编码。

·全局集合,和广义集合定义方式一样,但是编码效率比广义集合要高,因为它使用共享的键头,这和原始键能够完全恢复的无压缩编码效果一样。

·局部集合,和广义集合编码方式一样,但是由于使用了简短的局部标识而有了更高的编码效率。这些标识只在局部集合中有意义,它保存了KLV数据结构的构架,但是局部标识需要有独立和具体的定义标准来定义其具体意义。同时也要定义局部标识如何映射在广义的标识键值中。

·可变长度包,用来定义为一个数据元素的深度分组(并且移除了组中所有元素的UL键和局部标识)的使用。可变长度包依赖于定义包中数据元素顺序的标准或规范。

·定长包,不仅移除了UL键和局部标识的使用,同时也去除了组中所有单个元素的长度。因此,定长包基于定义了包中数据元素的命令和每个数据元素长度的标准。这样使得定长包成为编码最有效率但也是最不灵活的数据元素编组。

集合和包是由很多KLV集合和大包数据的结构编码归组的单个数据元素组成。它们由SMPTE注册机关给予注册的广义标识键所定义。由集合编码的数据元素可能不仅仅是一个数据字典的项目,同时可能是其他包和集合的元素;而包只能编码一个数据字典中的一组单个项目,如它们不能使用循环递归编码。键的第5个字节定义了集合和包,第6字节定义了集合和包的类型。

标签是标识标签自己定义的有意义(或者值)的对象的特殊类型。因此,标签不需要长度域和值域,它们要在特殊的标签字典中被定义。

4.5.2可扩展标记语言

可扩展标记语言(eXtensible Markup Language, XML)是由W3C定义,由SGML(见3.5.2.1节)发展而来的非常灵活的文本格式。XML最初被大型电子出版业使用,现在已用于更广泛的数据范围(特别是网络)。它为数据内容定义了一个容器格式和自动验证结构,如XML描述了一个数据对象类(称为XML文档)并部分描述了计算机程序处理过程的行为。XML的设计目标是:

·在互联网上直接使用。

·支持广泛的应用。

·可以与SGML相媲美。

·优化处理XML文档的程序开发。

·最小化的可操作特征。

·XML编码文档易懂,可以方便、快速地建立。

·XML文档易被建立。

XML定义了文档建立的方式、描述了文档的结构、指定了其要包含的实体。XML文档的关键元素是标记,它以标签的方式存在,最常用的是封装文本元素的开始标签和结束标签。标签被用于结构化文档和部分文档。标签还组成实体和参数属性、描述、文档类型和XML声明,以及处理指令和内部别名。

根据标签的定义和文档类型的声明,并没有规定具体的结构,如并没有定义XML文档的具体形式、所包含元素的数量、元素的格式,以及判断一个好的XML文档的具体标准。XML1.0定义了一个文档需要包含一个或者多个元素,每个元素都由开始标签和结束标签限定。因此,它提供了一个语义框架以形成完整的能够供检索系统使用的XML文档。除了简单元素之外,XML文档还包含属性,即文档中可以赋值的实体。

如果XML文档中没有任何元素的深层定义和量化、没有元素的特征和关系、没有元素在文档中出现的次数统计以及没有给定文档结构中的指定位置,XML文档就不能被编译。因为没有参考点,所以就不能决定文档是否是完好的和有效的。另外,为了交换XML文档中的信息,有必要使所有参与的部分有着和文档内容一样的结构意义和编译方法。可以应用一个XML方案来指定XML文档元素的特征和关系以及XML文档类的属性。信息和文档的分类以及交换由具体的XML方案或者文档类型优化。这基本为特殊文档类型定义了一个框架。有很多XML方案可以用于定义XML文档类型和指定分类。最常用的是文档类型定义(Document Type Definitions, DTD)和W3C XML方案。

内容管理中重要的是不仅可以将XML应用于文档,还可以将其应用于数据流。因此,除了适合基本的文件转换以外,XML还特别适用于内容传输。

4.5.2.1文档类型定义

能够指定XML文档结构的一种形式是使用DTD。DTD是用非XML语法写成的,它描述了特定文档类型的文档结构和允许的内容。DTD基于SGML使用扩展的Bakus-Naur形式(Extended Bakus-Naur Form, EBNF)。DTD声明了XML的文档类型、元素和属性。因为它主要是定义文档的(即它的中心是文档定义而不是数据定义),所以不太支持多种数据类型。DTD只声明元素的特征数据而不指定该数据类型。因此,它不能指定数据类型的所属范围和具体元素的属性,它只给出某一个类型的文档所应该包含的结构和元素。

4.5.2.2W3C XML方案

W3C最初指定了用XML语义的XML方案,它不仅定义了XML文档和文档类型的结构,还综合了XML命名空间、结构方案、数据类型以及继承用法。W3C XML方案定义(XML Scheme Definition, XSD)的三种主要方案——XML方案第0部分:入门;XML方案第1部分:结构;XML方案第2部分:数据类型。第1部分定义了XML方案的定义语言,它用来描述XSD所定义的XML文档的结构和内容组成。第2部分描述了一些植入的、基本的数据类型(如整数、日期和二进制数据),并定义了附加数据类型用XML方案的定义语言定义的方法。XSD提供和DTD相似的元素类型声明和属性声明的机制,另外它还支持对于最大和最小出现频率的定义。

XSD和DTD最大的不同是XSD定义了数据类型列表。XSD区别了简单数据类型和推导出的数据类型。推导出的数据类型定义了由规则和列表推导出的进一步的数据类型。

除了简单数据类型,第2部分还定义了很多的推导数据类型(如规则字符串、名称、ID、长短字节等)。XSD定义的命名空间要加xsd命名空间前缀。

同类推荐
  • 普通高中教育的精气神

    普通高中教育的精气神

    本书主要内容由六部分组成:第一部分对甘肃省普通高中教育发展的近百年历史沿革进行了检索性回顾和梳理;第二部分比较系统地介绍了甘肃省创建省级示范性普通高中评估验收标准;第三部分对甘肃省创建省级示范性普通高中工作过程和主要做法进行了总结;第四部分选择兰州市第五十八中学(原兰州炼油厂第一中学)作为省级示范性高中校园文化建设范例,全面介绍了该校“校园文化建设手册”基本框架和内容体系;第五部分集中介绍了47所省级示范性普通高中学校的办学理念。需要声明的是,办学理念、校训等排列顺序重新进行了逻辑规范;第六部分对甘肃教育强县——会宁县普通高中教育发展的成功经验进行了总结。
  • 身体语言密码大全集(超值金版)

    身体语言密码大全集(超值金版)

    学会读懂和使用身体语言,是一门成功必修课,是洞悉先机、掌控全局的保证。《身体语言密码大全集》由盛乐编著,对身体语言的表现形态、深刻内涵及其广泛运用进行了全面而深入的解读,为你破译身体语言的种种密码,带你走进人类潜意识的最深处,帮你看穿他人的真实意图,窥破人际关系的奥妙,掌握和运用比说话更高效的沟通技巧。《身体语言密码大全集》适合大众阅读。
  • 国际传播发展战略

    国际传播发展战略

    《国际传播发展战略》以全球化为切入点,结合当今世界主要传媒集团的发展现状,对国际传播发展战略进行详细评析,并以对国际传播能力的评价体系为基础,对中央提出的增强国际传播能力、打造国际一流媒体等发展战略,进行理性思考和经验总结。在编写过程中,《国际传播发展战略》力图做到宏观战略与中观策略、微观措施相结合,既充分体现国际传播理论研究的全球眼光,又体现出国际传播实践的中国视野。
  • 中国电视新闻媒介生态研究

    中国电视新闻媒介生态研究

    从对电视新闻媒介生态的剖析,且着重从负面的剖析着手,引向对这一问题的正面思考。在转型期这一有限时段内,探求电视新闻媒介生态发展与变化的规律、趋势,以期优化、提高电视新闻媒介的生态质量和信息传播效果,继而在整个社会生态系统的范围内赢得最大的社会效益和经济效益。
  • 陶行知谈教育(名家谈教育)

    陶行知谈教育(名家谈教育)

    《陶行知谈教育(名家谈教育)》一书分为两个部分,共收录陶行知关于教育和人生的文章33篇。主要收录了能够代表陶行知教育思想的全部重要文章,如《教学合一》《生活教育之特质》《活的教育》《行是知之始》等;第二部分的文章是陶行知所写其他方面的文章,包括回忆育才学校办学的历史和教育宣言等方面的文章。
热门推荐
  • 速度之巅

    速度之巅

    公路车运动是最考验人体力意志的运动。单纯的骑游可以强身健体。消耗脂肪速度为排第三的瘦身有氧运动。想要完美身材?来骑车!天成的美景,动人的友情,温暖的亲情,燃烧的爱情。(注:后续故事请移步《骑出一个未来》观看,见谅。)
  • 祥瑞劫

    祥瑞劫

    贞元三年,钦天监上书曰:“今圣贤明,令太平成象。”于是十道百州,尽献祥瑞以悦圣。
  • 马营村

    马营村

    陈家桥1972年生于安徽六安,1993年毕业于南京某高校,上世纪90年代初开始文学创作。早期写诗,从1994年开始小说创作,至今发表出版小说作品约五百万字,其中长篇小说有《坍塌》《化妆时代》《男虚》《永远爱你》《女疼》《阿P》《南京爱情》《刘行远》《北京爱情》《成都爱情》《1956》《一个女人的五故事》《云南往事》《少年王》《别动》《长安行》《法国女友》等十几部,中短篇小说约一百多篇,有小说集《危险的金鱼》《中如珠宝店》《见爸爸去》《暗香》等。
  • 麻辣农女

    麻辣农女

    【古言1V1】病娇偏执纨绔的赫连王爷突然变得呆萌。被世人说败坏门风的李星星突然变成某人掌上明珠。“星星大人,您说我长得可爱吗?”“呵呵哒,你要是可爱世界上就没有丑的。”一对欢喜冤家。一段山盟海誓。李星星放火,赫连倾城添柴。李星星杀人,赫连倾城递刀。李星星:赫连倾城,你要大声说出你的爱!赫连倾城:我赫连某,一辈子最爱李星星……的枕头……的主人!见到赫连倾城之前李星星不知道竟然可以喜欢一个人到如此地步,甘心共赴地狱。“倾城,让我和你一起堕落吧!”“你这个女人说什么堕落!滚!”他为她赴汤蹈火,她为他万死不辞!PS:文风甜中带虐,结局美好,至少百万完结。欢迎入坑,不喜删书。
  • 灵犀纪事

    灵犀纪事

    斗转星移,时光惘然,灵犀阁的阁主已经迟暮之年,垂垂老矣。她很想讲一个故事给所有人听,可是她已经没有力气,她所能做的就是把回忆里的一切都拿出来反复温习咀嚼,那是属于她的故事,也是属于这个江湖的故事——by灵犀纪事
  • 拒嫁太子,庶女狠逍遥

    拒嫁太子,庶女狠逍遥

    【本文一对一,系女强+宠文+复仇+宫斗+宅斗为一体】成亲一年,丈夫从未踏入她房中一步,只因她不是他所爱之人。不哭不闹,换来的竟是阴谋陷害,一场大火尸骨无存。再次醒来,竟然成了丈夫不受宠的庶妹,既然老天给了机会,她又怎么能浪费?定要让所有有负她们的人付出代价!爹不亲娘不爱?无妨,她会被让他们悔不当初。姨娘们轻贱嘲弄,不怕,她会让她们从此没脸见人。嫡姐嫡兄羞辱打骂,不急,她会让他们知道被人欺辱的滋味!就连下人也随意喝使?不慌,她会让他们明白,谁才是主人!不就是‘不小心’将姨娘们偷情养小白脸的‘好事’公之于众,又‘不小心’的让嫡姐的贵妃梦破碎,可这个太子殿下怎么就抓着她不放了?
  • 中国民间禁忌风俗

    中国民间禁忌风俗

    本书包括禁忌的起源、日常生活中的禁忌、各行各业的禁忌、人生一世的禁忌、万事万物的禁忌以及禳解禁忌免遭惩罚等方面的知识。
  • 横行诸天的怪兽之王

    横行诸天的怪兽之王

    井现黄龙,将星陨落。寿维达:“扯犊子,我就一黄鳝,你们哪只眼睛看到是黄龙的?”重生于井底做黄鳝的寿维达表示这锅他不背。他倒是想做龙来着,可惜踏错了路,只能做怪兽了。
  • 冷少的娇妻

    冷少的娇妻

    她是艾宝儿,艾氏的小公主,集万千宠爱于一身,只是这一切在家族事业倒塌那一刻,荡然无存,被父亲亲自推出去牺牲,丢了最后的一点尊严,从此变得没心没肺,冷看人生。他京都商业巨贾,传闻他阴森冷血,邪肆残暴,如同恶魔般存在的男人,却独独宠着一个女人,宠到令人发指的地步。正文:门外,冷擎浑身是嗜血的杀气,仿佛是从地狱爬出来的撒旦,冰冷残暴的眼眸里是深深的刺痛与野兽般的哀鸣。“为什么!”男人怒吼,就像垂死的野兽。艾宝儿低下头,遮住眼里闪过的一丝不明情绪,再抬起头时,她嘴角已经带了一丝笑容,随手捡起一边的衬衫披上,走到男人的身边,指尖轻点他心脏的位置:“冷擎,我很早就说过的,这里,别对着我敞开。”“可是,我爱你啊。”他喉咙有些干涩,出口的话低沉沙哑,带着无尽的悲伤。艾宝儿转开眼,心竟然有一丝陌生的酸以及淡淡的疼。她看着屋内的冷天宇,淡声道:“我不爱你,一点也不爱,我要爱的,是他。”
  • Pincher Martin