10.4.2.1自动内容处理的发展
现有的自动内容分析和处理工具,将会基于目前的技术得到进一步的改进和发展。然而,为了满足用户的需求和期望,还需要在低层次的数据处理器的基础上考虑语义分析。如何自动完成这项工作目前仍然处于探讨中。由于低层次数据处理器使用纯技术和数学的方式,语义属性已经超越了单纯的分析处理,进入了知识领域。人们在这个领域已经做了大量的研究工作,但是在内容管理中它还没有能和自动分析工具一起得以应用。
除了媒体的语义分析外,也应该在自动内容处理中考虑输入其他的参数以提高成效。例如,为了促进图像相似性信息查询,不仅仅把图例作为输入参数,也包括用户环境(例如用户的职务、部门和兴趣等等),这些信息可以从用户档案里获得(并不需要用户在搜索时额外地输入)。通过联系关于内容的附加信息以及对照用户档案的相关因素,能提高所找到的相似图像的命中级别。例如,如果一个政治评论编辑使用一个人的图像,那么,这个人物在政治领域的图像将会排在最前面。
另一个例子就是在视频自动分析时,使用一个关于特殊领域预先计算好的信息。例如在体育运动电影胶片中的人群场景就很少包含有相关的信息,但是它们却在关键帧中反映出了图像内容的明显变化,这时需要附加的分类信息用来抑制这种帧,给予它们较低的优先级。
因此,有两种技术可以进一步提高自动内容处理和分析处理,一种是使用环境变量和附加输入参数来进一步提炼自动分析结果,另一种是对低水平的数据描述符使用媒体语义学。前者可能不仅仅是一个工程任务,后者也仍然需要大量的研究工作。由于媒体语义学不能由纯技术方法获取,这就需要有一个交叉学科的解决方法。
10.4.2.2信息与元数据的管理
随着内容数量的快速增长及复杂程度,但描述方案却又不相容,导致了内容管理系统处理大量的信息变得更加的困难。甚至于一个更加详细的描述也并不一定意味着更好的搜索结果,相反,可能更难于对相关的信息进行定位。就是同义词分析、专业化描述、特殊的分类方案也帮不上忙,因为这些只有技术娴熟的用户才会应用。欧洲一家大型传播机构进行的调查表明,当内容被经过训练的编目人员处理以后,编辑们却发现要找到相关内容反而变得更加困难。看来,我们需要一个更为自然的方法来进行内容的表述和定位。
达到以上目的的方法之一就是要把握条目的含义,该条目对内容进行描述并且以自己的表示方式来反映,这种实体法提供实现这一目的的途径。它们有助于描述与特殊主题领域相关的知识,并且可以建立一个网络来描述该类知识的空间。例如,当搜寻关于可以引起特定疾病(例如腹泻)细菌的特殊媒体内容时候,人们并不需要知道该种细菌的确切名称。通过对这种症状的描述,本方法就可以提供相关特殊领域的条目以及详细的解释和相关内容对象的链接。这个过程超越了目前的搜索过程并且包含了一个完整的知识范围,在这个知识范围中来进行相关信息的查询。这也允许获取更加详细的信息或是当找到某个相关的主题时把它探究到底。与万维网网页中的超级链接相反,这些链接并不是按照用户的意愿来设置的而是源于对知识的表述。
由于要求大量的专业领域知识(也包括一般知识),因此创建这种方法将是一个相对劳动密集的工作。这项工作将由自动工具来推动,但仍然需要一些人工操作。这些工作也并不一定要由技术熟练的人员来完成。既然实体法是“生动的和学习中的”系统,它将可以通过自身的使用来得以提高。因此,我们要鼓励在内容管理系统中使用它,这也反映了语言的自然使用与发展。因此从长远看,实体法可能会替换特殊的编目规则和同义词汇编。
如何有效地构建实体法以及如何把现存数据和信息系统中的知识转译到这样的知识网络中,还有待进一步地研究。
10.4.2.3未来的基础结构
内容管理系统将一直都是一个包含极大数量复杂模块的大型系统。不同的设施、服务以及第三方组件将成为这样一个系统的组成部分。此外,我们已经看到内容丰富的机构,例如传播机构可能不会只包含单一的大型内容管理系统,而可能是大量交互的自治系统。不同的内容管理系统间的交互甚至可以跨越机构,因此内容管理系统的结构体系还必须发展。在这里非常重要的两个方面就是如何组成一个内容管理系统(也就是如何组织针对不同模块的接口)以及不同的大型独立系统间的交互。理想情况下,所有这些对于用户来说都是透明的,也就是用户没有必要知道内容存放的位置或它们是如何被访问的。
关于不同内容管理系统模块的构造,目前非常详细的体系结构包括核心元素素材管理器、设备管理器与数据管理器以及大量的服务,以上可能会发展成为一个更加通用的结构体系,其区别只是设备(包括SAN作为存储设施)和存放(或是提供)元数据的组件。
设备服务器(如6.4.2中介绍)的结构,具有作为一个通用组件所要求的所有特性。它把一个设备看作一个部件,这个部件可以存储素材和与素材对象相关的某种元数据,并且它也拥有存储管理功能,可以提供文档访问和文档传输功能,它也拥有交互特性例如流播放、记录功能等等。这样的一种设备可以用作素材管理专门记录、存储和提供某种素材。在这个广义的特性描述中,“设备”几乎可以是任意装置,例如可以是一个视频服务器、一个存档系统、一个简单的文件系统、一个FTP服务器、一个磁盘记录仪、一个录像机、一个装有大量录像带和多个录像机的磁带管理系统等。把这个概念作为一种设计理念将生成一种发行式素材管理,允许任何种类的系统集成并把素材导入总的内容管理系统的概念,共享元数据,对素材进行发行。这种方法的关键,就是通过唯一的资料标识符(例如SMPTE UMID)来确保每个设备上的素材拥有唯一的身份,对于一个给定的素材,它的所有实例和格式拥有相同的标识符。在这种情况下,通过这个标识符将发行式素材与相关元数据联系到一起。
一个更加抽象的观点是,允许在内容管理系统环境下使各种相关的系统设施能够容易地集成。然而,即使素材管理与设备管理的概念进入到了下一个更加抽象的层次。在本书中表述的基本概念和设计原则(例如服务群和代理管理概念)仍然非常重要。这些原则确保了联合数据库与信息系统的伸缩性和集成。
人们预测系统之间的通信功能将更强,也就是不同的内容管理系统将被链接起来并且在它们之间可以交换内容。这也包括内容管理系统将变得更加分散,它的每个分散的组件控制着内容丰富机构全部内容的一部分。为了实现这个目标,内容管理系统可以构建自主协作系统,每个系统独立控制着素材和元数据的存储与管理。然而,为了增强内容的可用性,在其他的系统可以重复内容,这可以应用前摄或缓冲算法来完成。有协作能力的内容管理系统能够共享一系列公共接口与核心元数据集,这是非常重要的。在这种情况下可以看到相关技术和概念在IETF的CDN/CDI创新中得以发展。对等原则也提供了令人感兴趣的、适于开发的观点。此外,GRID的创新一直在发展与内容管理与内容发行相关的概念。
总的来说,将来大规模系统的结构可能是通过使用自主系统的概念,并且要由规则来控制和协调,而非仅仅建立于严格的层次客户端/服务器的拓扑结构上。存储结构可能会构造成基于对等原则的自主存储群,以对等原则为其他组件提供服务。这仍然可以把存储单元看作服务器,只是它们内部并不是按照层级架构组织或控制的。这种想法就是要提供更佳的容错能力以及使用这些系统的恢复能力。
这种自主结构应用的有效程度如何以及它们的潜力何在,仍然是有待研究的课题。使用这些概念也可能会混淆产品和基于数据交流技术的发行系统之间的边界。然而,在与知识产权相关的问题没得到解决之前,这种混淆不会发生。
10.4.2.4知识产权管理与保护
到目前为止,内容管理系统几乎没有(或有一些)为IPR的管理提供支持,而只为IPR的保护做了一些基本的准备工作(例如水印服务的形式)。通常内容丰富的组织机构中存在一些内部规则,这些规则会阻止与版权有关的内容大规模地对大众公开。既然内容主要是在内部处理并且通过传统渠道来传送(例如陆路传递、电缆或卫星),这些传统渠道中的版权保护问题并不像在新数字媒体空间中那样严重,所以IPR保护的工作并没有被要求。
然而人们预测,随着传统传播业的变化,媒体组织将朝着多媒体内容生产、出版和通过多种渠道发行等方向发展,并将变得更加集成,版权管理和保护将成为一个更加相关、更加紧迫的领域。既然可以实现比较紧凑的集成,权限管理将变得相对容易地由现有内容管理系统来完成。
存在更多疑问的是版权保护问题。已有的技术还不够成熟,仍然没有达到一个可以在更为广泛的环境中应用的程度。哪一种方法是具有真正的技术性与实践相关性的,目前仍然不是很明确。由于目前还没有什么突破性的方案,水印仍是目前为止最受青睐的技术。此外,计算并把水印植入图像的操作,目前为止还不能够实时完成。在这种环境中,其他的技术例如指纹可能会更加适合。由于还没有设计建设新的发布渠道,近期IPR的规范也没有什么重大变化,那么发展相应的技术将显得非常困难。在这个领域中的基础性研究仍然具有开发空间。技术与法规成熟到具有在系统中开发、利用、发行数字多媒体内容的全部潜力,还将有待时日。