P.Conway曾说“随着时间的推移,我们记录信息的容量成倍增加,用于存储信息的媒体的寿命却在等价减少”[1]。云计算及其相关技术在数字资源存储及服务中的应用为数字资源长期保存创造了新的云仓储环境,也为图书馆联盟的发展提供了契机。2009年4月23日,OCLC正式宣布将向它的会员图书馆提供“基于云的”、Web规模的协作式图书馆管理服务,标志着图书馆的IT进入了“云”时代[2]。OCLC已开始了基于云仓储的大规模信息资源长期保存和共享的实践。图书馆联盟作为以资源共享理念为出发点的图书馆联合体,一方面要面对用户需求的多元化和泛在化,另一方面与日俱增的数字资源长期保存需求和资源共享需求也对其发展提出了新的要求。因此,图书馆联盟应当积极转变合作方式及其数字资源长期合作保存模式,建设相对全面的资源存储体系和更具适应性的合作保存模式。
云仓储是在云计算概念上的发展,是云计算技术的延伸。将大量数字资源存储于“云端”,不仅体现出云仓储环境中数字资源存储容量的巨大变化,而且可以实现对资源的集中监控和动态管理,从而解决数字资源长期保存在存储空间和有效管理方面的难题。数字资源长期保存工作的关键在于维护数字信息的真实性和永久可获得性。云仓储环境的优势主要在于提供了数字对象在整个数字生命周期内的完整、真实和可用性保障,这在便捷化共享的同时,既能无限量存储,又可降低保存成本。
各类型数字资源充斥于无处不在的用户需求环境,既往图书馆提供知识“栖身之地”的作用正被侵蚀,提供中介服务的数字资源优势正被挤压。数字保存意味着长期可存取,长期的访问意味着长期的管理过程和发展契机[3]。当海量数字资源存于云端时,数字资源保存前置以及保存和利用的同步化,将改变整个信息资源建设流程。同时,保存的起点不再是对数字资源单元利用后的存储,而是从高质量的数字对象选择和析出开始,在数字对象为科研、教育等所用的整个生命周期内对其进行持续管理,并使其能用于未来的知识发现与再利用,进而出现数字保管与资源保存并重的局面。
图书馆联盟已成为任何图书馆履行保存职能的依托。面对用户泛化的信息需求,图书馆对合作保存对象,即“资源”的界定也更加宽泛。政府和金融、医疗等行业信息化水平的逐步提高以及互联网应用与手持通讯设备的增多,将产生大量包括电子交易数据、用户档案、图像、音频、视频等在内的结构化与非结构化数据。此外,用户利用及其反馈、发现、组织的信息,即图书馆用户“大数据”,也将作为一种重要资源被纳入图书馆联盟的长期保存对象当中。用户对资源利用的综合需求促使图书馆联盟的数字资源长期保存应始终以利用为导向,加强对联盟内外大数据的整合和对数字资源的内容管理。
图书馆联盟能集结多类型数字资源,可通过云端共享将不同内容、不同类型资源有机关联,进而提高大规模数字资源保存的可增值性。云仓储所带来的资源存储量的无限增大和开放化共享,为图书馆进行大规模的知识发现及知识利用创造了条件。基于图书馆联盟的长期保存对象不仅包括成员图书馆已纳入各自馆藏体系的资源,还包括“联盟化”的“增值”馆藏和“特色”馆藏。
云仓储能实现资源价值和可共享范围的最大化,通过一次上传并保存于云端服务器中便可以实现资源的共享,相当于基于云端搭建了一个数字资源保存平台,用户可以通过“云终端”设备或者电脑、手机等连接互联网对该数据进行访问和使用,平台呈现出更加开放的特征。用户可以根据需求自行选择资源和服务,也可以进行资源利用反馈。也就是说,云仓储可以让更加庞大的异构资源通过标准化组织进行有效整合,并将其集中保存于云端,从而实现众多类型的重要资源的汇聚,为信息资源共享提供更加开放高效的平台,为用户提供更加轻松便捷的体验,充分激发其主动性和创造性。
云仓储改变了图书馆联盟已有的基于本地的、私有的、封闭的保存模式,打破了原来资源保存与共享的诸多壁垒,创新了合作保存模式,将资源仓储与服务提供有机结合起来,为信息资源共建共享提供了更加开放化的平台。数字资源长期保存关注的是“确保数字资源只要有需要就能持续访问的一系列管理活动[4]。”云仓储环境下数字资源保存的长期性、可用性和有效性需求凸显出权限控制和数据保管的重要性。将数据保管和资源保存放在同等重要的位置,有利于各个图书馆在图书馆联盟资源整合基础上对资源进行持续性、系统性维护和利用发掘,并提供个性化科学研究服务,是最终实现知识发现、体现数字资源长期保存意义的重要保证。
云仓储是一种技术应用,也是一种理念。基于图书馆联盟的数字资源合作保存在整合尽可能多资源的同时,还要进行大规模的知识发现,达到降低保存成本、促进资源互补及标准化组织的目的,合作的前移将促使信息资源的利用与共享更为便捷。
尽管目前不少图书馆联盟已经从最初的实体文献共享扩展为“实体”和“虚拟”相联合的共享形式,但仍依赖于联盟以各种形式向数据库商购买资源[5],伴随着出版商不断涨价,或采用印刷版捆绑销售及实施必选期刊限制等数字资源销售模式,图书馆购买数字资源的经济负担加重,现有的电子资源集团采购共享策略依然难以满足日益增长的资源存储与利用需求。
随着计算机技术的广泛应用,许多科研过程都会有海量科学数据的产出,从一定角度来看,未来的科研活动将是科学数据驱动的科研活动[6]。云仓储环境下,图书馆联盟的合作考虑的将不再是如何压低资源的价格进行合作购买,而是将买或者不买的决定权掌握在自己手中。图书馆联盟(LC)与其所面向的用户(U)、图书馆(L)、出版商(P)之间的合作关系将从“U—>P(—>L)—>LC”的模式转变为“U—>LC”模式(见图1),科研人员(也即信息用户)可以选择直接通过图书馆联盟的平台实现开放化的低成本的资源获取。一旦图书馆联盟实现合作电子出版,即联合介入数字资源“生产”,实现合作前移,图书馆就能拥有绝对自主的知识获取权,而不只是被动购买对数字资源的使用权。科研人员的科研成果通过机构库或者以开放存取期刊的形式公开,这样用户可以跨过数据库商实现对资源的获取。
突破资源利用的瓶颈还需联合最广泛的图书馆联盟,云仓储环境下基于联盟的国际资源整合与利用将成为重要趋势。2011年10月,“CALIS与OCLC合作会议”召开[7],合作备忘录的签署为双方在平等互利基础上发挥各自优势,扩大信息资源在全球范围的共建共享创造了条件,代表着图书馆联盟顺应全球化发展的一个趋势。图书馆联盟对国际资源的合作保存将由“R (资源)—>L—>LC—>L—>U”模式转变为“R—>LC—>U”模式(见图2),即国际资源不一定要由单个图书馆收藏后再纳入联盟的云端资源体系,而可以直接在图书馆联盟的平台实现整合与利用。同样,图书馆联盟提供的部分数字资源服务可以是直接面向终端用户的,进而弥补以往图书馆联盟的服务需要通过单个图书馆来联系终端用户这一不足之处。
图书馆联盟虽可以通过数字出版合作,在一定程度上缓解高额采购数字资源所带来的经济压力,但是由于涉及著作权和经济利益等诸多问题,所有的科研成果都绕过出版者和数据库商直接基于联盟实现共享是不现实的,从制度和技术等方面的投入上来说也都是困难的。图书馆联盟可以根据一定的条件向出版商购买开放出版的权限与服务,从原来采购出版后的文献转换为在出版前支付出版服务费,所出版的内容作为长期保存的重要对象可供永久地开放获取。2012年6月,OCLC与EBSCO建立合作伙伴关系,目的是提高服务的互操作性和知识发现的可能性。图书馆使用集成的EDS-WMS解决方案,将能够在OCLC下一代基于云的管理系统中进行编目、收购、许可证管理和流通,同时通过用户终端为其用户提供EDS发现服务[8]。图书馆联盟通过多种形式与出版商或数据库商建立合作,可以更好地利用云仓储环境提高数字资源长期保存合作效率,降低联盟的运作成本。
开放获取期刊的免费、无限制使用为图书馆数字资源的长期保存和利用带来了契机。随着开放获取期刊数量的不断增加,同其他类型的数字资源类似,基于图书馆联盟进行开放获取期刊的合作保存可以有效解决单个图书馆单独存储的局限问题。云仓储环境为数字资源长期保存创造的无限量和低成本存储优势使得全面保存所有开放获取期刊成为可能。同时,基于图书馆联盟的开放化平台将使得对开放获取期刊的利用和共享更为便捷有效,有利于加快科研成果的传播速度和广度,促进学术交流。
开放存取运动中,图书馆联盟不应只是被动的信息收集者,更应该是主动的信息生产者。目前在全球范围内发行的经过同行评审的高质量外文学术期刊中,相当大比例的期刊已成为开放获取期刊,具有较高的影响因子,显示出较高的学术利用价值。云仓储环境下,图书馆联盟重视对开放获取期刊的合作保存和共享,有助于打破受商业出版垄断的影响,增强科研成果的影响力,促进交流与知识再创造。2010年10月,中国科学院国家科学图书馆与开放获取出版机构BioMed Central签署了数字资源长期保存合作协议,该协议的签订,创立了国际重要开放获取资源在中国本土长期可靠保存和获取的新机制[9]。图书馆联盟应充分发挥云仓储环境的优势,创新数字资源长期保存合作方式以适应发展需求。
澳大利亚莫纳什大学图书馆的全局式保管(curation continuum)项目曾论证过数据的使用环境可以分为发布前共享环境及更正式的发布后长期保存环境两种,这两者间的交互阶段有一个素材传递的过程。云仓储环境下,图书馆联盟由原先被动地从信息发布或出版的末端购买资源进行存储的方式,转变为从资源产生的源头开始,通过合作出版及建立与数据库商的合作,或者通过支付开放出版服务费实现数字资源的开放获取,来促进学术交流与信息传播及对获取成本的整体控制。换言之,图书馆联盟从数据产生伊始便对其进行管理和完善。不难发现,基于图书馆联盟的资源长期保存过程是一个长期的动态合作过程,数据保管在这一持续性的过程中发挥着重要作用。对于动态数据集而言,数据保管意味着需要进行持续性补充和更新,以使数据符合用户需求[10]。图书馆联盟可以充分利用自身稳定性和可靠性优势,发挥数据保管的作用,为科研人员提供科学数据交流和知识共享的平台。国际物理开放出版资助联盟(SCOAP3)[11]模式也为图书馆联盟创新合作保存策略提供了范例。
云仓储环境下,数字资源长期保存对于图书馆来说依然是基础的职能。数字资源的复杂性及长期保存合作的前移使得对数字资源进行有效管理的需求更加突出,但在某种程度上提高了资源保障的可知晓性和可获得性。数字资源长期保存进入了存储与管理并重的时代。数字保存意味着一系列的管理活动,确保数字材料的长久可用性是所有组织尤其是在知识领域迟早需要解决的问题[12]。在资源质量监督与控制方面,图书馆联盟在选择数字资源作为保存的对象时,应充分考虑数字资源本身的质量与可用性,使其不断迎合广大用户的需求和图书馆联盟的使命,同时应将资源的潜在影响因素与附加值纳入考虑范围,加强对数字资源整个生命周期的介入与管理。在存储控制和服务提供方面,如何选择更适合本联盟的数据格式或资源版本,如何权衡与联盟发生合作关系的各方权利与利益以及维护联盟的整体收益,涉及图书馆联盟制度、标准、资金、技术、服务、规划等各个方面和资源建设的各个环节。云仓储环境下,各图书馆可以根据特定的需求有选择性地在不同的图书馆联盟中积极发挥作用。需求导向下的交错性合作模式为大规模的知识发现创造了条件,有助于解决联盟合作仓储体系中大量科研成果的知识挖掘和知识创造与利用问题。与此同时,对于资源存储利用与知识产权保护的协调问题也不容被忽视。
云仓储环境为实现大规模的资源关联提供了条件。准确认识数字对象间的相关性和差异性以促进资源整合,有利于统一跨系统各图书馆的业务规范与数据格式,实现各项标准的整体统一性,为数字资源的长期保存与共享提供条件。正如学术出版与学术资源联盟(SPARC)副总裁H.Joseph所言,若知识共享是科学研究进步的基础,那么知识共享的速度越快、范围越广,就越会加速科学研究的进程。基于图书馆联盟开展跨系统、跨地区的合作保存,实现资源的集中管理,不但有利于电子文件信息的长期保存,避免资源的重复建设和资源浪费,还可以有效地解决目前普遍存在的信息孤岛问题,最大程度地实现信息资源的共享和传递[13]。跨区域、跨系统的数字资源存储不仅能够促进跨项目组、跨专业的知识交流,也为有效利用及深度开发馆藏、实现信息资源的优化配置与共享提供了有力保障。不同的图书馆联盟之间也可以根据需求加强互助合作与资源共享,以跨联盟的合作带动跨系统宽领域的资源合作保存。通过不同的仓储策略和合作模式,可以实现各领域不同类型资源内容的保存与利用。云仓储环境为跨系统的众多类型图书馆开展合作保存与分布管理创造了有利条件,由此形成了基于新型图书馆联盟的动态数字资源中心,产生了整体之和大于部分的协同效应。
云仓储环境下,图书馆联盟成员不需要在本地硬盘上保存数据,也不需要维护自己的服务器,用户只需要拥有适当的终端设备便可以通过互联网查询和获取各类信息资源。为了有效实现以上合作模式,充分发挥合作保存优势,图书馆联盟应在数字资源整合的基础上充分调动成员馆的积极性,联合出资建设联盟自身门户化的支持多种移动终端的资源整合与利用平台,开发便捷、不受时空限制的大众化移动终端以供利用。通过这样的移动终端或应用接口,用户可以获得公共存储与访问服务,实现云端资源的共享,而不再需要通过搜索引擎查找所需资源。云仓储环境下数字资源长期保存的开放化与用户参与的特性为图书馆联盟开放全方位的用户交互服务提供了便利,开放化、有序化的资源整合与开发利用平台还将有效促进资源的自我维护和管理。
有效保护知识产权是云仓储环境下数字资源长期保存的核心。云仓储环境下数字资源长期保存更关注权限控制和产权保护以及由此衍生的利益均衡化。任何单一的图书馆所能存储的资源量总是有限的,而作为联盟成员馆的图书馆在为用户提供更大范围的信息服务的同时,拥有对使用权限的控制。成员馆不但可在图书馆联盟的“大云”下建设私有云平台,还可以整合本地服务和公共云服务,构建混合云,并通过对本地系统的适当改造无缝集成云服务,使用户不受时间和空间的限制,只需要一个登录账号便可以实现“云中漫游”。
云存储意味着存储可以作为一种服务,通过网络提供给用户[14]。对于图书馆联盟来说,详尽地了解每一个成员馆的每一位用户的需求是难以实现的。而作为联盟成员的各个图书馆却可以在图书馆联盟“资源云”的基础之上打造个性化的服务平台,针对本馆用户的需求开发个性化的使用功能。“大数据时代”已经来临[15],从各类渠道、不同领域内摄取用户信息并分析其阅读行为,已成为不可避免的诸多数据工作之一[16]。云端中的图书馆有效利用联盟大数据及资源关联,并用它来做出更好的决策[17],提供个性化服务,将用户数据和反馈信息作为一种资源加以高效利用并挖掘其价值,通过对资源的多重揭示促进用户对资源的利用,从而实现了资源和用户之间的有效互动。
截至2013年3月,OpenDOAR注册机构库已达2 270个[18],中国科学院拥有超过80个研究所的机构库[19]。机构的研究人员提供原始科研资料和研究发现,经评委筛选后确定作者所提供研究内容的质量和优先权,机构库再对这些资源进行规范、分类、整理后提供给终端用户,并承担着数字资源的长期保存任务。这些未经发表的实验记录、研究发现以及其他各类原始科研资料将在科学研究中发挥重要作用。此外,开放存取期刊作为机构库长期保存的重要资源,其有效开发和利用也将极大地促进科学研究的发展。在新的云仓储环境下,图书馆联盟要整合机构库资源,实现长期合作保存,可充分借鉴康奈尔大学图书馆arXiv.org开放知识库的可持续运营模式及ePrint开放机构知识库平台的深度服务经验,保证数字资源的质量和时效性,真正实现数字资源的长期存储与获取。图书馆联盟整合机构库资源实现联合保管与服务集成,实现优势互补,强化资源存储基础上的知识发现和创新服务,对于促进数字资源的开放获取、改进学术交流模式等具有积极意义。
图书馆联盟应充分利用云仓储环境带来的资源保存优势,积极转变联盟合作方式以及现有的数字资源长期保存合作模式,建设更为完善的资源存储体系和信息共享模式。国内图书馆联盟数字资源长期保存模式的建立可以借鉴国外相关实践经验,始终以用户需求为导向,平衡合作各方利益及合作效益,重视资源存储利用与知识产权保护的协调,实现整体协同效应。
上一篇: 期待危险品仓储正规化运营
下一篇: 医药物流中心仓储管理信息化建设探析