
2011-01-10
任丽君 林晔
(解放日报报业集团信息技术中心)
摘要:为了迎接新媒体的挑战,解放日报报业集团寻求新媒体和传统报业的融合发展,先后发展了以“4I”项目为代表的大批新媒体创新项目。在这些业务中,往往都要求传统报纸的版面和内容能够在数字新媒体渠道中整合发布。为此,解放日报报业集团研发了《多通道复合数字出版系统》。该系统不仅可以降低消耗在重复反解PS文件上的劳力,还可以汇聚各种形式的多媒体信息,并通过模版化快速拼版,整合再造成为适用于各种新媒体项目展示的新型数字报纸格式。最后,通过多种通道发布到不同的介质上,为集团各新媒体项目提供信息资讯。该系统专为报业集团新闻流程整合所设计,较好的解决了将传统报纸的资源运用到不同载体的快速制作和发布技术的问题。
关键字:多通道 复合出版 XML标准 一次制作多次生成
一、 引言
解放日报报业集团共拥有十一报三刊,这些报刊主要采用北大方正的飞腾软件进行组版,发排生成照排系统可以解释处理的PS文件。如果想提取报刊详细的版面信息,必须对PS文件进行反向解析。由于工作需要,集团有多个部门同时在做PS文件的反解,其中大部分的工作是重复的,包括:文章块的合并、标题正文的核对修改、版面信息的录入等。一个部门反解一份几十个版面的日报大概需要2至3小时,整个集团各个部门花费在反解集团十多张日报和周报PS文件上的人力和时间都颇为可观。为此,我们改造具有重复性的PS反解工作流程,设计由一个部门一次完成全部反解工作,然后共享给其他部门和不断扩展的新媒体项目使用。
此外,目前利用传统报纸制作的数字新媒体,往往一次制作只能在单一的介质上发布,而不能整合发布在多个平台上,如:集团数字传播中心制作的网站电子报不能用于电子阅读器、手机上等发布,新媒体部制作的彩信新闻也不能用于网站发布。一次制作只能一次发布,就限制了内容的最大化传播。所以,我们希望各个部门可以共享由反解PS文件生成的标准XML文件,然后在标准XML文件的基础上再做深入的精加工,如添加图片、音视频、Flash素材等,最后再一次生成多种格式的文件,以符合不同载体的交叉发布,从而实现“一次制作、多次生成”多通道复合出版的目标。
二、 系统特点
1、用户功能特点
1.1一次制作、多次生成
《多通道复合数字出版系统》的逻辑框架图如下。
图1 系统逻辑框架图
该系统完成了从原始数据的一次制作到多次生成不同格式的新媒体内容的完整流程。报社编辑可以通过多通道复合数字出版系统反解纸质报纸的PS文件,完成标引后将报纸内容引入到标准数据库中,然后按照报纸版面生成标准XML文件,再根据XML文件一次生成多个原汁原味的、符合不同载体需要的文件,如PDF文件、TRS文件、带特殊字段的XML文件等。
1.2模板化快速拼版
此外,新媒体编辑同时也可以从互联网上采集需要的文字、图片和音视频素材导入到标准数据库,然后对标准数据库内的新闻进行编辑审核后进行签发。经签发的新闻自动进入系统的“报纸制作”模块,再由编辑通过选择不同版式、不同风格的模版进行快速编辑、快速拼版,制作成区别于传统纸质报纸的新型数字报纸。最后将新型数字报纸一次生成不同格式的文件,整合发布到不同载体上。
快速拼版的模板,是程序设计师预先设计好的,其中包括排版设计(字体、字号、颜色、图文、视频位置)、动画效果、转场效果等各种辅助特效。由程序设计师按照设定的模板规范统一转换为可以使用的拼版模板,并且预处理了各种交互需要用到的程序代码。模板中抽取了各类可替换元素,包括文字、图像、声音、视频等。在编辑人员制作多媒体报纸的时候只需简单的替换就可以完成版面的设计制作。
2、程序设计特点
2.1严格遵循XML、CNML标准
多通道复合数字出版系统使用了一系列的新技术、新标准、新流程,从而推动多元传播格式下纸质报纸出版方式和报业新媒体发布模式的进步。在多通道复合数字出版系统中,XML语言作为标准格式来贯穿整个出版流程。XML指“可扩展标记语言”,是一种简单的数据存储语言。它使用一系列简单的标记来描述数据,被设计用来传输和存储数据,其焦点是数据的内容。而CNML即“中文新闻信息置标语言”,作为新的一种国家标准,目前应用于国内通讯社、报刊、新闻网站、电视台、广播电台等部门及媒体应用软件。
采用XML语言,可以简化数据共享。报社已运行的各种业务系统使用各种不兼容的格式来存储数据。而XML数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法。这让不同的应用程序共享数据变得更加容易。
采用XML语言,可以简化数据传输。通过XML语言,可以在报社不兼容的系统之间轻松地进行数据交换。各种不兼容的应用程序可以读取统一格式的XML数据,这样降低了数据交换的复杂性。
采用XML语言,可以使数据更有用。由于 XML 语言独立于各种应用程序,不同的应用程序都能够从XML数据源中进行数据访问。因此,通过XML语言,数据不做转换就可供各种阅读设备使用,包括手机、手持计算机、电子阅读器等。
2.2框架结构特点
在系统的框架设计上,多通道复合出版系统采用“对象”结构,抽象各种需求,使功能代码模块化,可以满足不同子报的特殊需求。整个软件系统分成几个类或功能,来模拟对象可以提出的需求和问题,并且在可能的情节中解决问题。每组项目代码即可以独立运行、也可以协同工作。
在技术上,采用了经典的C++编程环境和目前互联网上比较流行的技术,包括流媒体视频、音频、FLASH动画,脚本编程方式等。这种混合编程的方式,充分利用各类编程语言的特性和优点。在关键核心代码上采用C++环境编写,保证程序的高效,并可完全掌控技术细节;在信息提示和某些界面上系统采用B/S模式,可以快速开发、重复利用,灵活转换;在模板制作上系统则采用脚本代码方式,方便进行大量制作,最终在虚拟解释器上运行。
一、 创新之处
1、技术创新——开放化的数据库、标准化的技术格式

图2 数据交换严格遵循XML格式标准
该系统设计使用XML文件作为中间层交换的统一标准格式,共享给各种媒体使用。XML文件包括了版面MAP信息、文字内容、图片信息,具有良好的兼容性,成为生成其他不同格式的中间文件。这样,就可以利用XML文件“一键式”快速生成符合网站内容管理系统使用的TRS文件和EXE文件、集团资料中心使用的带详细信息的TXT文件、供电子阅读器使用的PDF文件和EBA文件等等。
2、整合创新——工作流程的化零为整、新闻内容的整合汇聚
解放日报报业集团下有多家纸质报纸和多种形式的数字新媒体,各报刊拥有自己的制作电子报纸的编辑人员,各数字新媒体也拥有各自的内容编辑人员。除此之外,集团资料中心还拥有固定的编辑人员用于制作历史数据。所有这些编辑人员的工作有一定程度的重复,如PS文件的反解和标引,对反解后生成的稿件的编辑和核查。通过使用多通道复合数字出版系统,我们将传统数字报纸制作流程进行整合,不再由各部门、子报单独反解PS文件,而是由固定的编辑人员统一完成PS反解工作,再将他的工作成果共享给不同子报、网站和新媒体部门,从而减少了重复劳动力,减轻了编辑的工作量。
除了将PS文件分解工作统一完成以减少资源的消耗外,我们还可以将内容整合汇聚再发布。在标准数据库内,不仅有传统报纸PS文件反解生成的稿件,也有编辑采集的来自互联网的各类素材,还有编辑自己原创的多媒体报道。同时,系统提供不同分类显示、全文搜索、权限设置、流程管理等功能。这样就为内容的汇合提供了技术平台。

图3 模板化快速拼版
3、渠道创新——数字版面的一次制作、多渠道发布
我们通过多通道复合数字出版系统,将编辑人员一次制作的数字报纸同时生成符合新媒体介质发布的各种文件格式。例如:资料中心收集历史数据使用的XML文件,集团网站使用的EXE、XML文件,手持阅读器使用的PDF和EBA文件,手机彩信报使用的HTML文件等。新型数字版面内容交叉发布到不同的媒体介质上,大大提高了制作效率,降低了数字报纸制作成本,扩大了数字报纸的覆盖面,增加了数字报纸的影响力。
一、 实施效果

图4系统生成《新新闻》,适配多种新媒体续道发布
一、 综合效益
使用多通道复合出版系统快速拼版、快速制作的新型数字报纸《新新闻》实现了每天整点发布新闻、专题形式展示新闻和相关新闻链接的功能,生成的PDF文件已经在电子阅读器上整点发布,生成的XML文件已在集团网站发布,取得了很好的社会效益。
此外,通过使用该系统,集团各部门由原来的重复劳动变为现在的统一反解PS文件、统一制作数字报纸。这样,大大减小了制作数字报纸所需要消耗的人力资源。同时,生成了多种新媒体格式的内容,可以为新媒体项目产生更多盈利。