登陆注册
3289000000017

第17章 内容的表达和元数据(1)

内容管理系统的核心是它管理的内容对象。内容管理的主要任务是在对象的生命周期内优化内容的处理和开发。对象的生命周期是指从内容的获取、制作、传输,到归档和存储的过程。内容对象在系统中怎样存储和表示对于检索和应用处理是至关重要的。然而内容的表示并不只与内容对象本身有关,还与内容对象所处的使用环境有关。因此,内容的表示模型应该考虑到这个因素,从而提供一个内容数据和信息的各种处理过程的抽象。

元数据是内容管理系统中不可或缺的部分,它被定义为“有关数据的数据”。元数据在从不同方面描述内容对象时考虑了不同的观点、方面、工作流、处理程序和存在的信息模型,这对于在需要时随时管理、搜索、查找、检索内容信息是很重要的。因此,内容的描述和描述的质量对内容管理系统提供快速便捷的查找内容的能力是很重要的。元数据要考虑不同的用户角色和与系统的交互运行,以及提供相应的视图。理想的内容管理系统支持所有的原始材料进入系统的创建处理过程和描述过程,以及所有相关工作和内容的分配、处理过程。这种情况下需要考虑的不仅是与内容的直接交互工作,还包括相关领域,如统计计算、权限管理和程序计划。

除了纯粹的描述和检索以外,元数据还管理着内容的内部组织和对外组织关系方式。因此,优化实际的交换和信息的转译交换都需要一定的标准。因为标准通常只提供大致的共同特征说明,标准本身并不能提供个体组织所需要的具体功能支持。因此,标准只能覆盖对于具体功能和主题背景很重要的特定方面。

目前已经开发出了很多数据模型、内容描述方案以及内容的表示和描述的参考模型。它们通常从不同角度描述内容,因此不是完全可比较的。不存在通用的内容描述方案。在内容管理系统中,针对不同方面的应用要使用不同的内容表示方案。本章给出了根据不同环境描述内容的概念。接下来介绍了元数据的结构和元数据方案应该捕获的信息。本章还介绍了元数据的交换和数据模型,介绍了许多主要表示模型和描述方案,以及元数据的编码和交换协议,给出了该领域目前的发展概况。另外,本章还说明了目前在不同环境下表示元数据的不同方法。具体方案或者模型的适合程度还要视其在具体实例中的使用情况而定,本章的讨论将有助于形成这种评价。

4.1内容的表示

内容对象的核心是素材,即包含实际信息或思想的部分。然而有时候内容的信息比内容对象本身还要重要,例如有关内容的所有管理任务。甚至在生产工作流中具体的元信息(元数据、摘要和低码率的素材版本)要比内容对象本身更重要(2.2.1节)。在这种情况下就需要选择适当的方法和适合的元数据,以表示对与内容对象有关的各种工作流和管理程序给予最好的支持。尽管数据模型、内容表示和工作流的详细信息根据不同的内容和不同的组织而不同,但是主要的内容特征和用例是大致相同的。

媒体对象(视频、音频轨道、图片等)可以被表示成为所谓的“代理”。代理对应于基于特定环境的特定方面的内容的具体视图。代理更加强调特定特征,表示特定视图或可视化的具体属性,因此更容易访问。代理可以有不同的媒体形式。视音频内容可以用多媒体代理来表示(综合使用不同媒体类型来表示)。其他代理有:摘要、编辑决策列表(Edit Decision List, EDL)、数据库记录等。

纯文本代理是有关内容的文档,包括摘要、产品文档(如产品单)、校本、EDL、日志文件(例如和时码有关的文本转换语句和注解)、合约、法律文档等等。这一组代理包含了一般文本中表示内容或者内容的特定部分的所有文档类型,可以对这些文档建立索引以便查找。

数据库代理是存储于数据库管理系统(Database Management System, DBMS)的全部内容的表示。DBMS的特性是可以管理巨大数量的数据。内容对象被表示成为一种抽象模型,称为“数据模型”。数据模型存储于数据库中。所有相关特征由一个结构化文本表示器来采集,它能够优化简便查找,并重新按照属性查找。文本和数据库代理通常和元数据有关。元数据定义为描述核心创作媒体对象数据的数据,这种媒体对象包含创作者需要传递的实际信息。

多媒体代理是表示如低码率副本、视听摘要和不同媒体类型的组合内容的表示方法。内容的低码率副本可以不用实际接触材料就能预览,因此能在窄带宽的链接上传输,在低配置的设备上输出。视听摘要是视听内容的组合,这些摘要通过显示素材的一部分而提供了素材的纵览,典型代表有关键帧或浏览。视听摘要通常通过自动分析程序自动提取和编译。不同媒体类型的组合可以通过链接文本、图片视频和视听信息提供实际内容的更好的总览。例如,情节串联图板就是包含内容描述信息和片断的关键帧和时码的组合,还有与低分辨率素材副本有关的文字材料等。如果内容对象是连续媒体类型,那么不连续的媒体内容表示部分也有与内容对象时码有关的时间参数。

广义的多媒体代理可以被看做是元数据,它们有附属的特征而且主要对象是优化内容的表述和检索。多媒体代理的文本部分显然是元数据描述内容对象的一部分。可视化摘要也有描述的特性。然而,低码率内容副本则是不带有描述信息的对素材的表示。

4.2元数据:内容的描述

元数据用来描述内容并在系统和系统组件中表示内容,它要遍布整个媒体制作的工作流程,从预制作到存档。另外,它还要容纳权限不同及对内容不同方面感兴趣的不同用户组。因此,对于内容的描述,有不同的方面和目的。

元数据最初在计划阶段产生,在内容对象的整个生命周期内被使用和不断修正。使用元数据的阶段有:生产、传输、媒体管理和其他开发过程。元数据要捕捉程序计划、生产计划(包括原材料、个人计划和相关贡献的参考),还有计划阶段的编辑准备(绘制、调查、收集和情节串联)。元数据应用的其他程序和用例包括:文档撰写、IPR、许可证、分析数据和位置相关数据(存储管理、位置ID等)。另一组元数据是有关内容的使用和开发的,通常这部分包括传输历史记录、程序交换和程序材料的数据和内容销售的信息(市场信息)。新一类的元数据是有关在互联网上使用的内容的数据,此时的数据记录是有关历史访问记录、负责人员(版主或者编辑者)等方面的。

元数据必须捕获和描述过多的特征和工作流,因此存在处理元数据的不同方案和(子)系统。元数据可以根据它所描述的实体来进行分组,有关于对象和关于片段的元数据。关于对象的元数据包括所有以描述媒体对象的特定特征为主题的元数据,而关于片段的元数据用于描述由于空间或时间界限(如图片边界和时码)所分割的内容对象的一个部分。

4.2.1关于对象的元数据

关于对象的元数据将内容对象作为一个整体描述。部分关于对象的元数据是内容描述(主题、作者、导演等)、相关组织数据(如项目位置、责任编辑办公室等信息)、内容标识和参加团体(处理内容的个人或组织,及其关系、角色和权利)。另外,关于内容的元数据包括技术元数据和所有商业过程(包括媒体制作的所有工作流步骤)。

关于对象的元数据通常存储在数据库中,有时也存储在结构化文件中,以全文检索引擎建立索引,以便于检索。内容对象的相关文档(如注解和合同)也可以以电子形式存储和建立索引来方便搜索。当文档需要像元数据一样存储于硬盘上时(如文章的法律文件),这些文档的相关资料可以(有时是必须)存储于内容管理系统的数据模型之中。

4.2.1.1工作流和内容描述

为了便于内容管理,内容的特征要被获取为结构化元数据。这可以使用描述对象(实体)本身和对象间链接的提取程序来完成。此时,工作流是要考虑的最主要的处理过程。元数据通过工作流被合成,因此,这些工作流定义了内容生命周期特定点所产生的元数据。然而,元数据的产生和标记是由系统定义的。本节介绍一些一般的与内容管理有关的工作流(如内容获取和解析、制作、存储以及归档)。具体的分析需要根据实际的组织及其系统和工作流才能进行,这需要在处理内容的系统中独立进行。

元数据可能在生成的时候就被处理并联系到一部分素材上。记录的位置(比如通过GPS得到的)、日期、时间等信息在产生记录时就自动与材料相关联了。然而,通常在输入和解析过程中,内容进入系统,元数据与内容对象建立关联。

理想情况下,大多数在这个过程中加入的元数据被自动处理。这些信息有:材料相关参数和自动分析程序检索的数据。这个过程中收集到的元数据被编入元数据集合,这些集合的结构有赖于特定系统的实际数据模型。

在查找阶段收集的典型元数据主要是与材料相关的,包括:

·视频源格式。

·视频压缩格式。

·音频源格式。

·音频压缩格式。

·记录参数(摄像和话筒设置)。

·生产信息。

在上载过程中,加入元数据可以用来标识内容,同时也用来支持快速检索和提供一个初始水平,该信息通常要手动输入系统。上载过程中加入的典型的元数据有:

·生产序号。

·标题。

·日期、时间和位置。

·源名(如机构名称、摄像者等)。

·剪辑描述(画面内容的文本摘要)。

·起始或结束标志(磁带或文件的剪辑)。

·拍摄质量。

不同的系统、部门和用户都参与了制作过程,这表现在其产生、引用和用来检索的元数据中。这些不同的系统有服务器组件(上载、制作和播出服务器)、制作条目的记者和编辑、最终内容条目的编辑、提供材料的归档和编目的归档部门。在所有这些处理过程中,额外的元数据被制作出来,并且与内容对象相关联起来。下面的元数据集即表现了后期制作和非线性编辑的典型的关于对象元数据集的例子:

·文献开始或结束。

·时码。

·副标题。

·授权信息。

·电子VTR卡。

·剪辑者、编辑者和制作人的名字等。

附加元数据可能被制作和搜集在另外的元数据集合中,如编辑集合、传输集合、描述集合等等。这些元数据集合更加明确地指向具体的任务和工作流步骤。

一旦材料被制作好之后就可以被分发播出。在广播系统中,分发播出是根据节目单进行的,并且被记录在播出节目(Program as Broadcast, PasB)中,此时相关数据有:

·首播日期。

·首播时间。

·播出频道。

·统计信息(观众或听众数量)。

·重播信息。

内容条目的生命周期最后一步是分类和深层编目。在这一步中,内容被分类和详细描述,以便查找、访问和复用。在制作过程中,添加的元数据在这一步中被修正和整合。应用的分类方案有赖于媒体类型和具体组织结构。这个过程中添加的典型数据有:

·目录表。

·编目时间。

·题目分类。

·节目关系。

·摘要。

在这一步产生了详细的内容描述,也就是关于片段元数据的一部分。

4.2.1.2关于权利的元数据

知识产权(Intellectual Property Rights, IPR)是关于对象元数据的一种特殊类型,它和内容的开发以及内容管理过程有紧密联系。然而,IPR通常是在内容管理系统之外的独立的版权管理系统中被管理,这是由于内容管理系统还没有覆盖到复杂组织的结构和法律领域。版权管理系统维护着IPR体系、合同信息和其他与内容对象有关的法律文档。版权管理系统管理的信息要和内容管理系统中内容对象的信息联系起来。

IPR描述了特定内容对象的所有权和使用限制。这些权限有可能很复杂,通常需要专业人士的解释。该版权有所有权(作者、作曲者、导演、摄影师等)、演出权(演员、音乐家等)、个人版权和其他很多版权。在使用(重用)作品时要充分考虑版权拥有者的具体权利。因此要妥善保管内容对象的法律文档并及时更新。

除了要考虑所有权、用户限制之外,还要考虑以下版权:

·地域限制(通常指地理限制)。

·传输和传播方法(通过电视、电影、广播和网络)。

·传输和传播时间(先于或后于某一天)。

·使用期限。

·用户(传输者)数量。

不仅要注意内容管理系统中和数据有关的某些基本版权,还应该注意在内容对象中享有其他版权的对象内容。然而,因为组织和法律原因,这些只能是象征性的。内容管理系统的用户要从法律部门得到更多有关版权的信息,以便在能用到内容的情况下保证尊重所有的版权。

同类推荐
  • 王国与权力:撼动世界的《纽约时报》

    王国与权力:撼动世界的《纽约时报》

    作者特立斯从1953年开始在《纽约时报》工作了十余年。当他离开时报后,立刻就是回过头去采访自己曾经的同事,试图以时报不鼓励、不允许的方式刻画描述这个庞大的、能影响全美乃至全世界局势的机构。特立斯眼光犀利,笔触细腻,不仅在书中回溯了《纽约时报》的历史,还生动地再现了近百名时报人,以及他们在时报这个大机构中的庞杂关系,向读者展现了一幅上世纪五六十年代一流媒体从业者的群像。《王国与权力》初版于1969年,至今仍是关于《纽约时报》历史及运作方式首屈一指的参考书,开启了当时写作、出版媒体著作的潮流。
  • 对话:中国网络电视

    对话:中国网络电视

    前言在中国,做电视本来是广电系统的独家盛宴。近几年,各方力量都开始进入视频领域,这个领域的结构也随之发生了巨大的变化。在短短几年内,我们见证了在这个原本属于广电的视频领域,逐渐融入更多的行业,汇聚成一个“热闹江湖”的过程。我们花费一年时间,对进入视频领域的各方力量的“掌门人”进行了采访。他们的探索、实践、思考,体现了这个行业从萌芽、野蛮生长、混战到逐渐规律发展的过程,是“网络视频”或“网络电视”领域的宝贵财富。我们将这些思想汇集成册,希望能够成为这个行业发展到此阶段的一个见证。在本书的书名中,我们提到“网络电视”这个概念。目前在行业中,出现了很多……
  • 心语

    心语

    本书旨在实际的教学实践中收集和整理一些具体的资料,并通过一些较为典型的学困生案例尝试对学困生存在的现象、形成的原因、解决的办法进行探讨。
  • 每天读点社会学

    每天读点社会学

    本书是一本学习社会学的理想工具书。书中没有过多地使用专业术语,而是用生动、通俗的语言阐释了社会学的原理和理论流派,用社会学的思维来解读那些我们日常生活中普遍存在但又没有深入、全面思考的日常现象和社会问题——成长、学习、工作、交友、家庭、婚姻、群体生活等,指出某些看似孤立、特别的事件所折射出的社会学意义及对社会、对个体的影响,提供给我们一种社会学的思考方法,会用社会学的视角和思维观察、剖析种种生活现象;书中还分析了某些群体的特定行为和心理,可以让我们更深刻地了解他人,更好地为人处世。本书将给你一双社会学的“眼睛”,教你在日常生活中如何看待身边的人和事,如何了解生活环境、生活空间和社会秩序,如何发现普通现象背后隐含的社会和人性规律,如何用社会学的思维洞察事物表象,发现本质,帮助你更深刻地认识这个世界。
  • 学科建设与研究生教育新论

    学科建设与研究生教育新论

    本书由重庆师范大学研究生处组织编写,作为重庆市研究生创新教育的理论研究成果,围绕我国及重庆市学位与研究生教育的内涵式发展,从学科建设、研究生招生、研究生教育教学改革及创新、学位管理、研究生思政建设及专业学位发展等方面,对研究生创新教育进行了系列的理论探讨。
热门推荐
  • 追妻无门:女boss不好惹

    追妻无门:女boss不好惹

    青涩蜕变,如今她是能独当一面的女boss,爱了冷泽聿七年,也同样花了七年时间去忘记他。以为是陌路,他突然向他表白,扬言要娶她,她只当他是脑子抽风,他的殷勤她也全都无视。他帮她查她父母的死因,赶走身边情敌,解释当初拒绝她的告别,和故意对她冷漠都是无奈之举。突然爆出她父母的死居然和冷家有丝毫联系,还莫名跳出个公爵未婚夫,扬言要与她履行婚约。峰回路转,破镜还能重圆吗? PS:我又开新文了,每逢假期必书荒,新文《有你的世界遇到爱》,喜欢我的文的朋友可以来看看,这是重生类现言,对这个题材感兴趣的一定要收藏起来。
  • 闇光

    闇光

    教会了我信赖只不过是廉价说辞的那个人,都是我曾经的挚爱。秩序联邦的刽子手?亦或是它们用完就扔的一把刀?撕下那早已融入血肉之中的面具,我……究竟是谁?命运让我有了第二次选择的机会,而这一次……我将完美地展现我存在的意义
  • 原来日久当真可以生情

    原来日久当真可以生情

    她做梦都没想到,有一天自己竟然会爱上一个人。“阿漓,我带你去游乐园好不好?”那么幼稚的地方谁会去。“好。”“阿漓,我带你去L国看薰衣草好不好?”那么无聊的事谁会做。“好。”“阿漓,我带你去KodaIsland旅游好不好?”那么浪费时间。“好。”…………“阿漓,你爱上我好不好?”……“好……”
  • 阴阳诀

    阴阳诀

    爷爷传给孟凡一套叫做阴阳诀的古书。孟凡把此书卖给了一个神秘的美女朱琳琳。没想到自此之后,怪事频发,不仅好友韩胖莫名失踪,自己也收到了一些诡异莫名的照片。为了搞清楚怪事的缘由,孟凡与好友潘潇进入了阴森可怖的医科大学校医院。校医院处于至阴至煞之地,暗藏杀机,凶险异常。在校医院中,孟凡解开了一些谜团,却查到了更多匪夷所思的线索。孟凡逐渐发现,这些事情,竟然都与他有着密切的关联,而这仅仅只是开始,他隐约感到,一个毛骨悚然的巨大阴谋,正在把他拉向一个万劫不复的深渊……废弃多年的校医院,为什么会有闹鬼传闻?恢弘的千年古墓,埋葬着什么秘密?神秘壁画中的鬼脸墓主,究竟又是何人?
  • 三部曲么

    三部曲么

    眼前出现各式各样的人或物,浮浮沉沉,来不及看清全貌便又会被另一个物体所更替,毫无规律;耳边传来嘈杂声,各种声音俱全,重重叠叠,来不及听清前一段后一段便又传来,杂乱无章。
  • 我瓷真心甜

    我瓷真心甜

    (快穿1v1高甜)绑定了乖甜可爱的宿主,系统茶白欣慰:去吧!瓷瓷完成任务!怪·楚瓷·力:好!我一个能打十个!茶白:哎?打……等,等会儿!于是在楚瓷三百六十度无死角翻天之后……茶白:这跟说好的不一样!在旁默默纵容的崩坏男神低笑:瓷宝,来,抱。
  • 激励孩子成长的108个好故事(中华少年成长必读书)

    激励孩子成长的108个好故事(中华少年成长必读书)

    经历欢笑,经历泪水,才真正是一个完整的成长,因为有我们身边讲不完的故事,也因为有我们所熟识的人的陪伴,我们的成长才会那么丰富多彩,才会令我们心动着去等待下一站将要带来的转变。成长中的经历,永远是一本写不完的书,它的主语应该是人间的情感和所觉察到的人生之味,即生活所带来的痛苦、忧愁、快乐、思索与感悟。人生拥有成长,拥有智慧和感悟的成长,也将看到梦想的光芒,即在成长中能够触动心弦的那一抹青涩而诱人的颜色。追寻梦想和理想的脚步,其实也是成长。
  • 海贼之自创金手指

    海贼之自创金手指

    穿越海贼王,无人荒岛开局,没有系统,没有商城,没有恶魔果实,但是却重拾梦想自创金手指,不断的磨炼体质和意志蜕变成为一个强者。
  • 今天也是努力变美的一天

    今天也是努力变美的一天

    这个世界太过于可怕了。我不明白我做错了什么,我只是长得丑而已,为什么那么多人希望我去死?那好,那我就去死吧,成全你们。可是,我为什么没有死成?“恭喜方圆女士成为本系统第108任主人,我是小E,专门为了将您变美而来。”啥?!这是什么东西!!!
  • 快穿反派BOSS有点熟

    快穿反派BOSS有点熟

    程言死了,下班的时候被公交车撞死的,与她一起的还有她的哥哥,为了活下去,她莫名其妙的遇到了一只自称是上古神兽的火舞凤凰,从此开始了她穿梭各个世界征服反派boss之旅,美其名曰净化他们的心灵,拿走他们的灵力,实则这一切到头来不过都是某个人的阴谋而已。