内容摘要本文阐释了数字遗产概念及其信息形态特点,论述了数字遗产保护的必要性,从其信息的多种存在方式剖析了数字遗产利用与保存中面临的诸多障碍,探讨其中的技术与管理的影响因素,从其制作、维护和管理三个层面剖析提出可供参鉴的保护与管理策略。
关键词档案保护数字遗产数字信息文化遗产数字遗产作为文化遗产的一种新形式,具有文化遗
源,在社会教育、历史借鉴和知识传播上发挥重要的作用,同时也是社会发展的见证和人类文明的重要载体。由于数字遗产这种全新的“集体记忆”,在存储制作
与管理方面不同于普遍意义上的文物与遗迹,在信息服务方式与手段上迥异于一般的可移动文物,加之其内容再现对环境设备的极度依赖性,以及外界条件对内容的完整性、真实性和可靠性的强烈制约性,使得数字遗产更显著地具有脆弱性、易变性、以及缺乏安全性,一旦遭受破坏就会造成不可逆转的资源枯竭,因此,保护与管理数字遗产成为一项重要的工作。
文化遗产中的可移动文物中,有一类是文献遗产,“是全人类以文献形式保存与收集的记忆,记载了人类社会的重大变革、人类的重大发现和重大成果,是历史赋予全世界的、当代人和后代的文化资产。”,1978年11月28日联合国教科文组织通过《关于保护可移动文化遗产的建议》,认为:文化遗产除包括不可移动的文化物体外,还包括文献形态的可移动物品,即作为记录和传递
、录音录像带、机读记录、等,并将文献遗产称谓世界记忆。而数字遗产更是作为一种信息时代的产物,纳入文化遗产保护的范畴,成为联合国教科文组织关注的问题。
联合国教科文组织2002年11月制定了《数字遗产保护草案》,按照其定义:数字遗产是特有的人类知识和表达方式,这种独特资源包括数字形式生成的,或从现有的模拟资源转制为数字形式的,有关文化、教育、科学、管理信息,以及技术、法律、医学以及其他领域的信息。这些原生数字资源只有数字形式,没有其他形式,包括文本、数据库、静止及动画影像、音带、照片、软件与网页等。
当前数字遗产的价值主要通过数字信息来表现,而这种信息资源有多种形式,按照《数字遗产保护草案》,主要有:(1)存贮于特定载体(如光盘、磁盘和DV带等)的信息资源,(2)存贮于计算机数据库中的信息资源,(3)通过网络传播的资源信息。
由于数字遗产资源大多具有长期的、重大的价值和意义,加之其生命周期短,制约的条件与影响因素繁多,在信息存储与读取时对客观环境十分敏感,需要有意地制作、维护和管理才能保存下来,因此这类当代人和后代人的遗产需要认真地加以保护。
数字遗产是一种原生性的典型数字资源,是以“0、l”二进制数码,按特定序列排列组合而成的特定记录轨迹和方式,是在特定载体或动态信息传播中的数字信号集合体,是一种脉冲式数据形态。
这种数字信息不论是由数字形式生成的,或从现有的模拟资源转制而来的,其本质都是经过信息和电信号处理而形成的,即将模拟或实体内容转变为电信号,再
通过专用设备在额定电平范围内进行削波、整形,最后经过数据编码而形成的二进制的按一定规则排列的脉冲数据序列,即数字信息。
数据信息形态使得数字遗产在空间传输发展,信息终端管理、文献资源共享、网络信息传播和发布等方面有很大优势;其主要特点:(1)海量存储的容量使数字遗产内容充裕;(2)文字、音像的多媒体信息组合使其表现更加丰富;(3)极高的信息分辨率,使数字遗产内容更加清晰;(4)更加方便、快捷和多样化的检索利用功能;(5)远程传输使数字遗产的利用范围更加广泛,能实现信息异地;(6)很强的信息处理、再生功能和复制能力,使数字的运行具有动静不同的方式。
数字遗产的保存方式出现新的情况。一是可以静态保存在载体中进行长期存取;二是可以动态信息方式保存在系统和网络之中。第二种情况引发逻辑结构和物理结构不相一致的情况,加之数字遗产对硬软件设备的高度依赖性,对利用环境的极度敏感性,制约了其在时间延展性上的功能发挥,使得数字遗产出现了新的问题。
虽然数字遗产存在时间不长,但面对的问题不少,这类资源的开发利用受到各种条件的限制,其资源价值的体现与一般的文化遗产有根本的不同。遗产物质材料的变化,信息再现的不稳定性,以及资源利用的安全隐患等都会破坏数字遗产,特别是数字遗产硬件和软件的变迁,资源与材料保护方法的不确定,及支持性法律法规的缺乏,也会制约数字遗产的价值体现,数字遗产发生的无形之中的损毁,其破坏性和影响远大于一般文化遗产。
全世界的数字遗产正濒临丢失的危险。丢失的原因包括给数字遗产带来生命的硬件和软件的迅速更新换代,资源、责任及保护方法的不确定性,及支持性法律法规的缺乏。
解决数字遗产信息的长期保存是一个对未来意义重要的问题,它涉及各个国家的不同行业和部门,迄今为止,该问题尚未引起人们的重视。联合国科教文组织一直关注数字遗产保护的问题,2002年11月,联合国科教文组织在广泛征求各国对数字化产品的保护的意见后,制定了《数字遗产保护草案》,呼吁成员国及早重视这个问题。与此同时,一些遗产机构已经认识到互联网的不稳定性,希望采取一个前瞻性的方案以保证互联网信息多样性,但是它们的工作由于缺乏互联网信息保存的标准而受阻。出版法规需要调整才能将数字产品纳入国家的收藏范围,在制定时新政策应该确保所有对后世有价值的网页内容都真正受到保护。
信息载体由于客观环境及各种灾害的破坏,会发生多种形态的变化,主要表现为:(1)信息载体中的磁光盘等材料发生表面污斑、霉斑;材料老化变形、边缘下陷;(2)受到电磁场、空气氧化及酸腐蚀作用其记录介质出现电或化学腐蚀;(3)载体材料层结构破坏,出现深层刻痕,改变激光读取的光程及时间等。
由于载体材料的以上变化造成电子档案信号不够稳定,数字代码序列紊乱,信息信噪比的降低,出现较高的误码率与错码率,难以进行档案信息的正常检读。
(二)存贮于计算机数据库中信息资源的安全隐患数字遗产信息存储于计算机数据库中,信息的再现
受载体稳定性、客观环境及各种灾害的破坏、以及设备与软硬件的升级、不兼容等因素的影响,而发生信息读取的障碍,主要是:(1)由于计算机病毒发作、系统故障及误操作等,使得数字信息感染病毒而遭到破坏 、删 改: (2) 受到电磁脉冲 、磁 场 、机 械作用而造成数字信息的丢失 和损坏; (3)计算机数据库被轻易进入而导致存储信息的 丢失 、泄 密及内容的删改; (4)屏幕电磁辐射保护技术不 过硬 、不 完备, 使得窃密者通过收集信息的流通过程窃 取和篡改数字信息。(5) 一些非适用型或专业型数字遗 产, 由于没有同时保存相关的参数 、管 理数据及专用软 件, 出现设备及相关软件的不兼容, 使数字遗产面临不 可读取的威协; (6)数据库资源的动态信息文档, 在其数 据被不断被覆盖时未及时存贮或备份, 使原有的信息将 难以恢复。
数字遗产的网络信息对客观条件更加敏感, 易受到 外界环境 、自 然及人为灾害的破坏, 并存在对设备与软 硬件的升级 、不 兼容的极度依赖性, 在形成和网上传输 时稳定性和安全性有不少隐患, 主要是: (1)电脑黑客从 通 信 服 务 层 、操 作 系 统 层 以 及 应 用 程 序 、服 务 器 、路 由 器 、防 火墙等进入网络, 攻击存在大量安全缺陷的网络 层面, 对传输中的大量有价值和秘密的数字遗产信息进 行恶意修改, 使数字遗产所有者蒙受巨大损失; (2)数字 遗产信息在传输过程中虽然采取了加密措施, 但是由于 保密软件技术不过硬或者密码被破译, 数字化信息被截 获并破译, 非法用户也可能趁合法用户从网上断开时乘 机接入, 使数字遗产传到非法终端; (3)数字遗产信息传 输过程的专用网络与因特网以及其它公众网未采取物 理隔离, 使非法用户轻而易举地看到数字遗产重要的信 息参数; (4) 计算机病毒程序能修改和传染其它程序, 造 成数据丢失和系统崩溃, 网络中计算机病毒是很难彻底
清除的, 因此数字遗产网络资源将面临病毒的侵害; (5) 复杂的网络系统和并存的不同操作系统间极有可能造 成设备间的冲突, 网络环境下系统故障的频发, 导致系 统运行失败, 造成数字遗产信息的损毁, 网络环境中技 术安全措施不过硬, 非授权用户搭线截取并破译了合法 用户正在查阅使用的数字遗产密文信息。 此外, 自然灾 害 、人 为操作失误 、电 源故障等也会造成数字遗产网络 资源利用的不安全。
此外, 对于网页(网站)信息, 一方面由于网站之间的 链接和交互式导航经常会断开, 导致信息丢失, 存在收 集的困难; 另一方面是由于数据库产生的动态信息隐藏 在许多网站的静态页面之下, 复制网页不能捕获数据库 包含的数倍于表面信息的“深层网页”信息。
数 字 遗 产 信 息 在 存 取 与 利 用 中 存 在 信 息 失 控 、干 扰 、丢 失 、窃 取的现象, 以及病毒侵犯 、人 为破坏等不安 全因素, 给数字遗产的长期存储 、信 息传输和运行带来 很大的危害。其中既有外界因素, 也有系统内部因素, 还 有人为管理因素, 因此制约信息安全因素是多方面的。 从宏观层次上看, 其根本原因是: (1)缺乏系统 、完 备
的标准化体系, 部分内容还没有纳入规范化管理机制, 对新领域、新学科内容研究不深、不 透, 存在不少的盲区 和理论空白点; (2)标准制定后, 执行不力, 存在不少的漏 洞和死角; (3)缺乏执行相关标准的配套约束机制, 影响 标准与规范的效率发挥。
微观层面上的具体表现为: (1)信息载体选材的随意 性、制作过程的不规范、设备与支持软件的缺 陷; (2)保存 环境的不适宜性、信息支持软件与 读取环境不具备时间 延续性和兼容性; (3)数字遗产利用与维护等环节中存在
技术缺陷、管理标准化程度不高、手段不合理 ; (4)工作人 员专业素养不高, 对数字遗产处理不科学, 采用不当的 保护措施; (5)缺乏完善的安全管理机制和对各种灾害的 应急措施等。
此外, 存储介质的降级, 相应软件失效, 计算机的新 系统和外围配置不支持老产品, 也会使遗产数据保存的 困难和功能的障碍。
确保数字遗产的长期可靠性, 必须从数字遗产的制 作(形成)、维护和管理三个环节进行科学合理的操作。
数字遗产的有意制作, 即确保数字遗产的优质形 成 , 主 要 涉 及 存 储 介 质 、存 储 格 式 、存 储 条 件(硬 件 、软 件、环境等)等内容。
1.数字遗产存储载体的选择。 应当考虑: (1)选择对 环境要求低、不容易损伤的、耐久性能高 的介质; (2)数据 的不可更改性, 具有数据强保全能力; (2)存储空间的容 量恰当; (3)费用低的介质; (4)应使用离线存储介质。 此 外, 具有稳定的市场支持和广泛的可接受性, 成为数字 遗产数据的安全性与长期保存的有效性的保证。目前主
要的载体有: 光盘 、软 硬磁盘 、以 及DV磁带 、优 盘及移动 硬盘、磁盘阵列等。
2.数字遗产的存储格式。 一般应选择稳定性 、通 用 性强的文件格式。由于各国各地区的公文和处理方式的 不同, 对电子档案的指定不尽相同, 但目的都是要确保 信息的安全与稳定。其他国家与地区的规定与我国略有 差别, 但主要内容大致相近。根据国家档案局《电子文件 归档与管理规范》(GB/T18894- 2002)中规定, 指定各种类 型 的 文 件 存 储 格 式 : (1) 文 字 型 电 子 文 件 以XML、RTF、 TXT为通用格式; (2) 扫描型电子文件以JPEG、TIFF为 通 用格式; (3)视频与多媒体电子文件以MPEG、AVI为 通用 格式; (4)音频电子文件以WAV、MP3为通用格式。以上主 要是对公文对外交换的档案格式和存档文件的档案格 式进行的法律层面上的规定。数字遗产的格式可以参照 执行。
在其他国家与地区, 长期存贮的文件格式选择大 致相同。如(1)台湾地区规定: 用XML语法定义出各种公 文内容结构的各种制式撰稿、 收文和发文的公文处理 作 业 使 用 中 文 码 BIG5 码 、BIG5E 码 、 中 文 标 准 交 换 CNS11643码的语言; 公文文件则可采用6种类型: PDF、 JPEG、IGES、MPEG等 形式; 地形图数据值资料文件采用 DGN格式。(2)香港地区规定: 中文电子记录采用BIG5码,
MART、DPR、DGN、IGES。(3)目 前国 际 通 用 的 文 件 存 储 格式主要有PDF、XML。这两种存储格式的通用性强 , 文 件的稳定性强, 适用于长期存贮的电子档案信息。
3.信息存储与利用条件的优化和有效。确保信息存 储与利用条件的优化和有效 , 必须加强硬件系统的维 护, 首先通过环境温度与湿度的调控, 火灾 、灰 尘与静电 的防护 、以 及电源系统的维护等, 保证计算机工作环境 的正常。其次是加强对显示器的经常性维护。第三是维 护好光盘与磁盘驱动器。第四是正确操作和使用计算机 硬件与设备、硬件故障的维护 。 此外还必须加强软件操 作系统、应用软件的维护 , 减少电源与设备故障的发生, 延长其使用寿命。
通过相应的技术手段和方法, 减少数字遗产在运行 与存贮过程中的信息丢失和破坏, 使其能够在更广泛的 空间和更长久的时间发挥重要作用。更新、仿真、迁移和 有效的数据恢复就是有效的技术方案, 能科学地地维护 数字遗产的信息安全。
1.备份。 在形成电子档案的同时, 根据信息长期保 存的原则和档案价值大小差别, 将电子档案的信息备份 到另外的耐久性更强的载体上, 以便长期稳定的处理档 案信息。
2.拷贝。拷贝是在原来的技术环境下定时重写信息 数据, 防止由于载体理化性能变化引起的信息丢失。 这 在前面的备份系统的建立中已详细介绍。但拷贝不能解 决电子档案由于软硬件技术过时引起的长期保管问题, 解决这个问题可供考虑的是迁移。
3.迁移。迁移是将数字信息从一种技术环境转换到 另一种技术环境上的复制。迁移是随技术变化适时改变 数字信息格式的一种处理过程, 它使得信息在将来也可 以被存取。迁移要求计算机可以读取旧格式, 也可以将 它写在新格式上。当电子文件迁移到新的技术环境后, 还需要通过各种技术措施来维护其在当前技术下的可 处理性。这样, 维护电子文件的可处理性 、迁 移 、再 维护 电子文件在新技术环境下的可处理性 、再 迁移 、再 维护
的防病毒与黑客技术, 制定高强度的安全协议, 采用多 级信息安全措施, 建立网络和信息体系的事故探测和告 警系统。
2.数据库与网络资源的安全保护。 主要有: (1)建立 数字遗产备份系统。实现多层次的综合运用, 利用硬件 级备份防止物理故障, 结合软件级和人工级备份的方 式, 防止因软件或误操作造成的逻辑错误, 实现多级保 护; (2)通过防拷贝技术和信息加密技术, 保障数据库与 网络资源的安全性; (3)通过特定网段服务的访问控制体 系, 安全漏洞检查, 入侵性攻击的监控, 合理可靠的备份 和恢复机制, 隐藏内部信息的多层防御及安全监控中心 等, 以及各种网络基本安全技术, 加强数字遗产信息在 数据库与网络中的安全传输。
数字遗产保护是一个新的课题和研究方向, 而在此 领域有众多的知识和内容需要进行认识和探索, 无论是 观念、理论思维, 还是相关的法律意识 、技 术支撑都有太 多的空白和不足需要弥补和完善, 笔者藉此文, 引起大 家的思考和关注, 共同来维护和加强文化遗产中这一片 新领地的开拓, 使数字遗产能长期地 、稳 定地保存与传 承下去, 造福于后人。
件。是在这个软件中对某一硬件进行模仿, 使得人们认 为原始设备与功能在现行软硬件上运行。仿真是延迟技 术淘汰的一种方法。通俗地说 , 仿真器是升级的软件, 如 现在一般的软件都具有向下兼容性就有仿真的意义。尽 管这种方法具有一定的可行性, 但对于新型硬件和软件 不断涌现, 制造一个执行过时软硬件的软件, 不太可能 是有效的办法。
有效地保存数字遗产是一个世界性的问题, 难过介 质管理 、标 准化操作, 有针对性地加强数字遗产保护与 管理的法律与技术防范手段, 确保其在存贮 、利 用的安 全与稳定。
l.数字遗产管理的基本策略。主要有 : (1)加强数字遗 产载体的管理与耐久性研究, 建立健全信息材料与遗产 利用的相关技术标准; (2)制订数字遗产管理与保护一体 化方案, 确保数字遗产的完整性、线)加 强协作, 在共同研究与攻关中进行知识教育培训 、人 才 队伍建设, 建立健全相关政策与法规制度; (4)研究国情, 改变数字遗产管理的地区差异, 确保数字遗产信息安全 和长期使用; (5)构建数字遗产信息安全体系。 研究有效
3.郑玉歆 、郑 易生:《自然文化遗产管理———中 外理 论与实践》, 社会科学文献出版社2003年版。
4. 刘家真:《拯救数字信息———数 据安全存储与读 取策略研究》, 科学出版社2005年版。
6.汤子瀛 :《计 算 机 网 络 技 术 及 应 用》, 电 子 科 技 大 学出版社1998年版。
8.智勇、黄奇:《网络环境下的信息安全》,《中国图 书馆学报》2002年第2期。
(作者: 彭远明, 南京政治学院上海分院信 息管理系,邮编: 200433, 电线,