COAIM 1/4
2000年4月 |
第一届农业信息管理磋商会全体会议文件 |
工 作 文 件 |
2000年6月5-7日,罗马 |
农业信息管理标准和准则 |
1. 采纳标准对确保农业信息的质量、可获得性、实用性和及时性十分重要。
2. 粮农组织规范作用方面的主要任务之一,是促进为提高全世界农业发展和粮食安全计划的效益制定并通过标准和准则。全球粮食和农业信息及预警系统(http://www.fao.org/giews)是粮农组织努力促进国际社会伙伴采用标准的一个事例。
3. 粮农组织预警系统计划的成功,主要得归功于为收集、分析和传播全世界同预警系统有关的信息制定了标准和程序。建立预警系统,结果是通过提供一个国际框架,预先查明存在受粮食短缺影响的风险的人口位置,从而获得充分的时间作出反应,对尽量减轻全世界发生饥荒的风险产生了重要的作用。因此,预警系统计划所制定的标准,在过去25年中对拯救世界许多地区人口的生命作出了重要的贡献。
4. 因特网为满足全世界农业发展和粮食安全的信息需要提供了重大的机遇。然而,利用现有的因特网工具和技术搜寻和检索相关信息显然存在严重的限制。预警系统计划构成了如何利用标准和准则奠定及时有效收集、管理和交付相关信息的框架的事例。
5. 显然,农业发展和粮食安全的众多领域中已有许多标准,建议粮农组织信息管理计划仅使用其中任何一种特定标准来满足所有用户的需要,既无实效也不可行。粮农组织在本文中提出供磋商会审议的方针是,依据国际接受和现有的行业标准,联系农业发展和粮食安全不同技术领域中公认的国际词库1 ,建立一个 农业信息管理标准框架。
6. 然而,仅仅通过标准、分类体系和商定词汇不足以满足本质上属于多学科性的所有农业发展和粮食安全的信息需要。这就要求信息系统能够以一致的方式,使农业内部不同学科之间及农业与其它部门如保健、贸易和教育等之间的相关主题相联系。为了实现所有这些目标,需要国家和国际两级各有关方面和伙伴积极合作。有关通过国际合作加强信息和知识管理能力的文件更加详细地论述了这一重要问题。
7. 本文首先着重论述随着因特网的形成而发生的"信息革命"。此后,它概述了同农业信息管理标准有关的主要问题及粮农组织本身在这一领域的作用,包括保持和进一步扩充AGROVOC(多语言农业词库)。 然后提出了支持农业发展和粮食安全的标准的具体应用次序,根本点在于粮农组织的规范作用。然后请磋商会审议推动农业信息管理标准计划的一项建议。
8. 正如全会文件"为可持续发展和粮食安全获得信息和交流"中指出,有关万维网网站和国际用户数量的统计表明了因特网的巨大规模和范围。然而,因特网上提供的信息浩瀚,现已超越了我们的信息管理能力。
9. 因特网并非真正为管理大量信息,更不用说是为“信息革命” 而设计的。正如上文提到的有关全会文件中提供的统计资料表明的那样, 因特网上现有的信息和数据量正在失去控制,目前能够有效管理这些信息的工 具极少。由于因特网结构的性质,相关主题的信息分散在全世界许多不同的服 务器上,然而目前能够综合不同来源的相关信息的工具却极少。结果,很难在 因特网上找到需要的东西。
10.现有的搜索引擎覆盖的信息不足因特网现有信息总量的15%? 而且提供的搜索结果太多而不相关。例如,全世界共有16亿网页,利用现有的 许多搜索引擎之一搜索"水牛管理"(Buffalo Management)一词,得到的结果极难处理: 不仅提供了符合这条标准的9.3万多个网站,而且还存在与语义学有关的一个重要问题。实际上搜索引擎提供的大量结果涉及叫做布法罗(Buffalo)的一个美国城市,其中一条提供了有关在布法罗大学管理学院就读的详细信息。 或许这对某些人来说是有趣的,但与水牛群管理毫不相干。
11. 事实情况是因特网上的信息没有良好的组织,探索引擎又极少依靠人建立更好 地对现有信息分类的元数据 2。而且,对商定词汇如多语言词库AGROVOC的 使用极其有限,而这些词汇至少将保证信息供应者和接收者所使用的关键词的 相关性 .
12. 大型搜索引擎确实为便于检索做了因特网索引,但都是自动生成而未能依靠人 进行增值分类,未使用商定的词汇和标准。这可能使搜索引擎对关键词查找作 出迅速反应,但除了提供太多的不相关的结果之外,还往往提供过时的信息。
13. 即使当搜索引擎最终确实提供看来当前而且相关的结果时,随后与资料来源相 联系的行动往往失败? #典型原因或是主服务器暂时无法利用,或者甚至更糟的是因为该信息已经消 失(即让人讨厌的error 404,“对象未找到”)。搜索引擎这种不友好的性质是自动产生的元数据与详尽信息对象储存位置随 后可能发生的变化之间缺乏同步协调的结果。由此形成 了因特网最主要的缺陷之一:即信息单位由其物理位置(即 URL)而不是由独特的无论信息移往何处都将跟踪的标识符定义。
14 所有这些问题主要产生于以下事实:因特网起初并非视作全球获得信息的一种 手段,信息管理的根本标准不太适当。即使在因特网上发表文件的商定的国际标准即HTML(超文本标识语言)也不完全适当。HTML是IE和Netscape等浏览器以一致而标准的方法释读和显示因特网文件所使用的语言,无论用于网上冲浪的计算机设备和操作系统软件种类如何。然而,HTML是一种非灵活标准,使用预定的标识符和陈述标识与数据的特殊混合结构,有时还使用ASP和JAVA等程序编码加以进一步补充 。HTML文件经受不起时间考验。假如HTML演变成新的东西,为 了确保其知识资本,许多组织将面临非常严重的遗产问题。应用代码、陈述标 识与内容的逻辑分离是完成这项任务的唯一方法。这是一项新标准的根本概念 ,叫做 XML 3(可扩展标识语言),下文我们将反复几次谈到这项重要的新的国际 标准。
15. 因此,我们遇到了因特网极其自相矛盾的现象:即它既具有全球传递信息的极 佳而前所未有的潜力,又产生了全球信息管理问题!这些问题只能通过采取以下行动才能加以解决:
16. 农业部门与其它许多部门不同的一项重要特征是,农业科学和研究文献不会非 常迅速过时,几十年前相关的许多农业技术、方法和研究结论至今仍然适用。 这意味着农业文献必须以经受得起时间考验的格式储存。
17. 上文已经指出,HTML并非特别好的一种文件存档标准,因为其内容、格式和程 序没有得到合理区分。允许进行这种区分的唯一现行国际标准是 SGML(标准通 用置标语言)及其因特网派生标准:XML。
18. 粮农组织正在使用 SGML 和 XML两种标准,一方面保存本组织的机构记忆库,但同时促进通过因特网传播 组织文件库(可见 http://www.fao.org/docrep)的信息。
19. 粮农组织秘书处请磋商会审议把 SGML/XML 作为文件管理的标准。
20. 然而,内容管理标准如 SGML/XML 本身并不足以促进因特网上的数据获得和交换 。有必要建立商定的国际分类计划,如 AGRIS/CARIS(国际农业科学和技术信息系统/当前农业研究信息系统)主题分类、国际商定的词汇如多语言农业词库 AGROVOC。AGROVOC 以及其它国际词库如国际农业和生物科学中心所编写的词库等 词库工具使之可能一致而确切地使用农业术语。
21. 在因特网上公布信息时,增值元数据应当与所公布的信息相联系,提供日后将 促进数据检索的确切的关键词和分类目录。这就是粮农组织信息检索器(http://www.fao.org/waicent/search/default.asp)的根本观念:在粮农组织网站上发表的每一个网页,都使用 AGRIS 主题目录和AGROVOC术语在检索器数据库中建立一条相关记录。然后最终用户可按照信息制作者考虑的 相同的确切词汇,使用这些相同类目和 AGROVOC 术语从粮农组织网站上检索数据。信息检索器既提供了有效搜索信息的平台,又提供了其标准。如果信息制作者或最终用户不能肯定该使用哪些确切的词汇,可查询随时可得的联机 AGROVOC 词库 http://www.fao.org/agrovoc。
22. 粮农组织秘书处请磋商会审议通过并推广使用商定词汇和分类方法(如 AGROVOC 和 AGRIS/CARIS 主题类目)以便改进农业信息管理。
23. 如果大量的农业网站采用同样或相关的分类和索引标准,则将大大促进数据检 索和数据交流。使用相同的总体信息管理方法的网站越多,就越容易使不同来 源的信息相联系。为了使联系更加方便,可签订国际协定,对不同农业领域中 的关键数据成分作出定义(例如,说明关键数据成分,以促进交换有关植物遗 传资源或有关林产品的信息)。这些标准也可适用于更加普遍的信息种类,例 如交换有关农业项目、专家和机构的数据。XML文件种类定义(DTD)和 XML模式属于这方面应当加以探 讨的一些标准。
24. 粮农组织秘书处请磋商会确认必需确定共同数据成分,以便有效地利用和交流 农业信息。
25. 通过采用如上所述的那些国际分类体系、商定词汇、开放标准4和共同数据成分 ,将有可能解决因特网的信息管理问题。然而,仍有需要为因特网上的农业信 息确定此类标准以及支配这些标准的程序和准则。农业信息管理磋商会为成员 国提供了作为高度优先事项审议这一问题的独特机会。
26. 食品法典是粮农组织如何有效地为制定国际食品规范和标准的政府间过程提供 服务的一个极佳事例。食品法典委员会(食典委)经其所有成员国透彻审议之 后,通过建议的国际标准、准则和行为守则。建立食典系统的目的是保护消费 者健康、确保公平的国际食品贸易方法以及协调所有国际食品标准工作。普遍 统一的食品标准的优点是保护消费者免受不安全食品的影响,通过打破人为的 非关税贸易壁垒,允许食品生产者、加工者和贸易商进入市场。食典标准已为 人们接受,作为乌拉圭回合贸易协定中评价国家食品措施和条例的基准。
27. 世界农业信息中心不仅提供信息系统平台,以获得粮农组织支持成员国的信息 、统计资料、知识和专业技能,而且发挥了作为规范机制为政府间过程提供服 务的作用,以解决一般的信息管理问题,并帮助建立国家农业信息系统。
28. 尤其是粮农组织与国际伙伴合作,可向成员国提供:
29. 此外,粮农组织在其伙伴的支持下,可协调和促进国际一级的活动,以便:
30. 以下为粮农组织如何在信息管理方面发挥其规范作用以支持成员国的一些实际 事例。
31. 因特网为传递信息提供了前所未有的机遇,但同时也带来了严重的信息管理问题,如何处理这些问题尚无国际协议。为了改进因特网的信息管理和数据交换,迫切需要制定标准、程序和准则。
32. 一般标准奠定信息系统的共同基础。这些标准促进背景不同和专业知识种类不同的人之间的理解和交流,促进各组织内部和各组织之间以及跨越硬件和软件环境的数据和信息分享。制定标准需要数据制作者和数据使用者之间的合作,但这并非易事,国际一级的合作尤其如此。在签订关于农业信息管理国际标准的协定过程中,成员国或许希望请粮农组织发挥讨论根本问题的中立论坛的作用,并通过世界农业信息中心利用粮农组织的规范服务加快这一进程。
33. 尤其是粮农组织与农业部门其它各方密切合作,可协助成员国采纳内容管理的国际标准如SGML和 XML 语 言,并就用户分类方法如 AGRIS/CARIS 主题类目和商定词汇如多语言 AGROVOC 词库达成国际协议。
34. 成员国或许还希望研究对农业词库 AGROVOC 作可能的增补和扩充,从而能够加以调整,甚至成为研究人 员和科学家的一种精确而有效的工具。AGROVOC 为改进因特网信息管理奠定了极好的基础,但随着信息环境的迅速变化以及信息生产不断分散化的趋势,应当仔细评价现有结构及其功能。尤其是如能确定与其它广泛使用的词汇如国际农业和生物科学中心词库的正式联系,将使功能性得到重大改进。而且,可能需要在 AGROVOC 目前能够提供的范围以外,为某些特定主题领域建立更加专业化和更加确切的词汇,这些词汇甚至将不适宜列入一种总词库。然而,AGROVOC 与这类专门词库联系将是有益的,应当建立这种联系。实现这种增值扩充之后,AGROVOC(粮农组织内 部称为 AGROVOX)可能成为本千年的农业信息管理工具!
35. 农业信息管理磋商会或许希望确认,影响因特网农业信息获得和数据交换的某些关键问题,可通过 达成有关内容管理标准、分类方法和商定词汇的国际协议加以解决。为此,磋商会可能希望审议本文的具体提议和建议。
36. 磋商会或许希望请粮农组织与农业部门的其它有关各方协作,协调和促进成员国采纳和推广此类标 准。
37. 磋商会或许希望建议把粮农组织万维网站作为交流农业部门信息管理标准的中心,公布达成的所有 国际协定、通过的程序和开发的工具。
1. 词库由一整套受到约束的商定词汇组成,分级或按照相关关系排列,每个词条都有独特而明确的词意。相关时,也可确定术语与其它口语词汇的等同关系(即同义词)。词库通常侧重某特定知识领域,各领域收集数百条至20 000条术语。另一方面,受到约束的词汇仅指一系列商定词汇,未确定各条术语之间的相互关系。
2. "元数据"一词指说明一项信息以便促进其检索或解释其内容的数据。元数据的一个事例是图书馆目录,图书馆目录提供有关书籍的内容和位置的增值信息。
3. XML是一种文字编码系统,编写便于因特网浏览器软件理解的结构化文件。XML和HTML均建立在文本逻辑单位两端使用"标识符"的基础上。然而,HTML局限于在万维网上提供文件,但XML提供了管理、检索和 交流文本信息的一个框架结构,发挥了类似于关系数据库为管理数据所提供的功能。XML允许各具体用 户小组开发其自身的一套标识符以满足其独特的需要,而又不限制以单一媒体单一风格加以陈述。有关XML更详细的信息可见http://www.w3.org/XML。