网络信息分类体系


史学斌 (湖北师范学院图书馆 湖北黄石 435002)

    

    
〔关键词〕 网络信息 分类体系 类目设置

 


〔摘 要〕 本文分析了网络信息分类现状,比较网络信息分类体系与传统分类体系之异同,并提出网络信息分类体系设计原则。


〔关键词〕 


 网络环境下,传统的文献分类方法在知识体系、类目划分、类目排列、类目关系处理、专指 度、信息标引、检索途径、检索方法、功能、用户定位和技术利用等方面存在一定的不适应 性。网络信息数量多而庞杂,变化快而不稳定,以及网络信息用户个性化需求使得传统的分类法难以在网络环境中得到充分的体现和发展,建立新的分类体系势在必行。


1 网络信息分类现状分析


网络信息分类的目的是有效地组织网络信息,并能最大效能地满足网络信息用户各种显在和潜在的需求。


1.1 网络信息的特点


数量多、内容庞杂。从某种程度上来说,各个图书馆收藏的传统文献信息资源(包括纸质文 献、各类光盘、声音、图像等)数量多、内容纷繁复杂,涉及各行各业以及生活的各个方面。而网络信息资源不仅包括收录有上述传统文献信息资源的全球的数字化图书馆,又有成千上万种电子期刊和报纸以及政府、学校和公司等机构和个人的详细信息。更何况网络信息没有限制,任何机构、个人都可以发布各类信息。因此成为无所不有的庞杂信息源,并具有跨地区,分布广,多语种,高度共享的特点。有最新的各类信息也有毫无价值的大量冗余信息,更可能还有各类病毒和有害信息。因此,网络信息资源数量巨大,内容庞杂。


变化快、稳定性差。网上的信息与传统的文献资料相比,具有极强的动态性且变化速度快,可以随时发布,也可及时变更修改,不但各种信息都处在不断淘汰、更新的状态,而且它所链接的网络、网站、网页也都处在不断的变化之中。


类型多、范围宽、用途广。网络信息类型多样化,其主要形式有网络出版物,包括电子期刊、网上图书、电子工具书等;动态信息主要包括新闻、广告、股市行情、天气、交通、会议等;还有大量的书目数据库、联机数据库、软件资源以及个人主页、电子邮件等。同时网络信息还有多种表现性,单就文本就有文字、符号、表格等,另外还有声音、动画、图形、图像等。网络信息另外还有范围宽泛的特点,它涵盖了人类知识的各个领域,既有人文科学、自然科学、进行理想的信息交流,如发电子邮件、召开在线视频会议等,可进行网上交易建立电子营销系统,日常人们可以完成的事物在网上基本均可实现,可见其用途广泛。


信息组织特殊、控制性差。传统印刷型文献通常是单线型的组织方式,主要通过参考文献、引用注释或二次文献等方式来解释相关文献,用户要查找文献相当费时费力。而因特网上信息的组织则以超文本技术链接,构成立体网状文献链,把不同国家地区、不同服务器、各种网页、各类不同文献的相关信息都通过节点链接起来,使得检索相关文献、相关信息非常方便,加强了信息间的关联度,形成了一个网状结构。虽然从局部来说某个网站、某个数据库是有控制的、相对集中的、有序和规范的。但总的来说互联网的信息没有统一的控制,知识信息的质量是良莠不齐,信息也处于分散、无序、不规范的状态之中。


1.2 网络信息用户的特点


网络信息用户首先从用户的层次各有不同,有科学家、企业家、政府工作人员、艺术工作者、普通工人、家庭主妇、中小学生等。不同层面的用户也会相应的产生适应于他们自身的信息需求。由于职业、专业的不同,以及受教育程度的高低差异,使得用户个体的认识和认知特征、知识储备和知识结构各不相同,对知识体系的了解也不尽相同。同时,对同一概念、同一事物的内涵和外延的理解也会存在差异,对网络信息需求的目的和需求信息的种类也不同。不同层面的网络信息用户更会因为所处环境、考察角度等方面的不同对网络信息产生方法、类型、深浅程度的不同需求。正是由于种种不同,致使网络信息用户会呈现差异性、复杂性。


2 网络分类体系与传统文献分类体系的比较


网络信息由于其自身的特点以及技术条件、技术环境的不同致使传统的文献分类体系并不完全适合在网络环境中运用。因此需要建立新的网络信息分类体系。网络信息分类体系在创建过程中还需从传统文献分类体系中吸取有利的因素,并结合新环境、新要求能够有所创新有所发展。对网络信息分类体系与传统文献分类体系在分类标准上、分类级次上、检索方法和手段上以及满足用户需求状况等进行比较分析,可明确进行网络信息分类体系设计。


2.1 从分类标准上对两者进行比较分析


传统文献分类法是以学科和逻辑划分为标准的严密而深细的分类体系。如《中图法》在归类上先以学科为标准分为22个大类,在每个大类下又根据逻辑关系从一般到具体、从宽到窄层层划分形成比较纵深的信息等级结构。这一分类标准极为稳定,通常遵循逻辑分类的原则进行,一次只采用一个标准,只有必要时才采用两个或两个以上标准。在横向联系上采用的是交替列类、编制注释和参见关系来揭示文献间的相互关系,但要达到客观而充分地揭示知识空间的立体联系还存在一定距离。在类目排列上主要借助于分类标识符来体现类目之间的关系。这种类目之间的关系是内在的、本质的,类目标识符只是作为这种关系的一种表现。


网络信息分类体系的类目设置标准。网络信息搜索引擎不再单以学科为标准组织网络信息资 源,大多从方便用户的角度出发以事物为中心来设置类目。然而有些网络分类系统,尤其是国内的网络分类系统也注重按学科设置类目,当然更为重视从事物对象和主题的角度来确定类目。总体来说,与传统学科分类体系有所不同,网络分类体系采用以事物为重或者事物与学科并重的分类方法。从所了解的资料来看,目前我国分类搜索引擎的大类体系,大多采用这种类目设置方式。如中文Yahoo、搜狐、新浪等网站。其中中文Yahoo将其主页类目分为艺术与人文、商业经济等14个大类,搜狐分为娱乐休闲、工商经济等18个大类,而新浪则分为新闻媒体、电脑网络等15个大类。这些大类均突出了教育、娱乐、旅行、生活等与日常生活密切相关、用户普遍感兴趣的类目,弱化了科学技术、学术性类目的设置。


网络信息分类体系类目展开。网络搜索引擎在按一定的标准确定大类后,往往在一些类目下同时采用两个或多个标准确定下位类。从实际使用的情况来看,搜索引擎大类的编制结构包括有以下三种情况:a.当大类为主题对象时,以主题对象为中心设置相关学科类,同时收入地区及各种资源类型。b.当大类为学科类时,以学科为主题设置相关主题对象类,同时收入地区及各种资源类型类。c.当大类为地区或资源类型时,地区下按我国政治区划分,各种资源类型进一步按类型的形式划分,再按主题内容区分,从而构成了与传统分类不同的划分与类目设置方式。


网络分类体系类目排列。讲究系统性,国外的类目排列由于其文字语言的特殊性采用的是查找方便的字顺排列。大多情况下遵循从用户角度出发的原则,对同位类的排列多按检索频率确定,在同位类中首先列举高频类、突出热门主题。因此当用户的偏好发生改变时,类目使用频率也会发生改变,因而增强了分类体系的动荡性,从而造成了一些困难。在横向关系揭示上,网络分类体系则采用链接的方式,通过在相关类下重复反映,使其成为类目关系的有机组成部分。目前搜索引擎对这类关系的揭示,最常见的是将横向关系在相关类下重复反映,并用@作为表示符。


 


2.2 从分类级次来进行比较分析


传统的分类体系是典型的树形结构体系,对文献信息的组织根据文献信息知识原有的内容逻 辑,按照统一标准,采用从一般到具体、由宽到窄的层层划分方式,从而形成相对纵深的信息等级结构。此种划分将某一概念在知识体系给予其准确的定位,从而使得各类文献信息均能根据这一方法在传统的分类体系中找到其明确的位置。因此,在传统的分类体系中,分类级次一般都比较纵深,反映得比较精细。有些甚至达到七、八级或更多类目。


网络信息分类体系在类目层次上与传统分类法有所不同,为了方便用户使用和节省用户的时间和精力,一般都不会设置层次过多。否则层次越多用户就会失去浏览该信息的兴趣。从实际使用的情况来看,类目层次设置与划分一般控制在三、四层之间最为适宜,专业栏目可以适当延伸。当然,在控制栏目层次的同时,栏目的设置可以不局限于单一标准的逻辑划分,而是可以使用若干标准同时对某一上级栏目进行划分,建立若干从属于上级栏目的平行的子栏目。由此,具有不同知识结构、不同检索目的与需求,有着不同分类标准的用户都可以在同一级栏目找到所需的信息,从而满足网络用户多途径、多角度的检索特性。从另一方面来说由于分类层次少,因此在类目设置上就不能过细、过于专业化。与此同时,为了便于用户把握类目范围和资源特点,必须加强类目的说明,增强分类体系的易用性和准确性。


2.3 从检索方法、手段来进行比较分析


在传统文献分类法下,分类号相当于一个对号入座的标签,在已知分类号的情况下的检索就是直接提取所需文献。其检索手段也主要是手检。即使通过光盘,利用计算机来检索,其原理也是一样的。在检索入口处键入相应的分类号,通过计算机在书目数据库中“提取”相匹配的文献信息。在众多检索方法中,利用分类号进行检索是检索效果最好的一种。不但检全率高,而且也有很强的检准率。


网络分类体系下的检索方法、检索手段与传统分类法下的检索方法、手段有所不同。首先,网络分类体系中存在分类标识符,更不可能直接根据分类标识符去提取信息。网络信息检索大致可以分为浏览检索和基于工具的检索。浏览检索以某节点作为入口词,通过节点间转换浏览网上信息。在浏览检索中,人们从某一学科或事物的大类信息开始,通过链接一个个节点,逐步确定自己的检索范围,这一过程便是直接从上位类到下位类的浏览检索过程。基于搜索引擎的检索主要是指进行关键词检索,直接在检索词入口输入检索对象、事物的关键词,然后进行相关搜索得到检索结果就行了。这与利用分类号检索有相似之处,但不同的是输入的关键词有确切的含义,它即代表所要检索的与之相关的事物和对象。其次,由于网络系统的突出特点是可以通过超文本技术的使用,实现对类目关系及信息资源的多维揭示,构成立体网状文献链,把不同国家、地区,各种服务器、各种网页、各种不同文献都通过节点链接起来。检索时,通过不同的检索路径来满足相同需求的不同用户。


2.4 从满足用户需求状况来比较分析


从满足用户需求、提供用户服务的角度来说,传统分类体系下的文献信息只能从单一的线性角度去满足用户需求。而且相对用户来说它的易用性并不好,只有当用户是图书情报专业人员才会比较熟悉图书分类法,才能根据需求确定相关类目的类号。若不了解图书分类知识和《中图法》,也只好求助于文献专业人员,但由于文献信息专业人员对所检索的信息的理解不同。因而查找出来的信息并不一定能满足用户的需求,有些信息甚至是完全没有用的。从另一方面来说,在已知分类的情况下就能方便、快捷、准确地找到所需信息,有效地满足用户的需求。


现在人们需求信息、查找信息都习惯于到网络中去查找,就其原因主要来说有以下几点:A.方便。用户需查找某一信息可以直接通过网络分类体系中不同的类目入口浏览查询一个个节点,找到相应节点直接链接所需信息即可。B.快捷。根据搜索引擎来查找信息,可以直接输入所需信息的关键词。在几秒种内就能在相关网络信息链中检索出所有的所需信息。C.易用性强。这是人们偏好在网上查找信息的很重要的原因。不需要懂得很多专业知识和高深的检索技巧。无论是老人还是小孩,也无论是中学生还是科学家,只要懂得电脑最最基本的操作就可以找到自己所需的信息。当然由于网络分类体系尚不够完善,巨量的网络信息还没有很好组织,会使得很多信息杂乱无章,影响用户对有效信息的需求。


3 网络信息分类体系设计原则


网络信息分类体系的设计,不但要考虑到网络信息数量多、内容庞杂,变化快、稳定性差、类型多样、范围宽、用途广以及网络信息组织特殊、控制性差的特点,还要考虑到网络信息用户的特点和个性差异。因此,借鉴传统分类体系长处的基础之上,根据新的类目设置展开及排列标准和分类层次,充分顾及到新技术环境下的检索方法、检索手段和技术条件,并从最大程度上满足用户需求的角度出发,而设计出的网络信息分类体系必然能够取得预期的效果。当然,在整个网络信息分类体系的设计过程中必然遵循以下几个原则:


3.1 实用性原则


所谓实用性原则就是要求类目设置不仅讲究全面更重要的是要精而有用。如在教育类中,在仅有中学教育就可清楚反映问题时就不需特意列出初中阶段教育类和高中阶段教育类。而对于一些需要从各个角度、各个方面多维反映的类目就应充分利用网状结构通过各个节点链接相关信息,以充分将有关信息有效地组织在相应的类目中,增强整个类目体系的整体性和有序性,同时也可提高检索过程的检全率。当然在需要适度细分而又不会减少用户使用兴趣的情况下,也可适当细分,使得信息更具有专指度,同时也可增强检索过程的检准率。因此,首先应遵循的也是对用户来说的实用性原则。 


3.2 自然性原则 


网络的用户是整个社会的民众,是处于各个不同知识、经济和能力层面的大众。因此网络在设置类目名称时最适宜采用不是学术性强、难以理解的专业术语,而应是通用、规范、内涵外延清晰的自然语言。在无规范化术语可用时,也可采用一些惯用语,同时在使用缩略语时应有相应的注释以明确其涵义。另外,由于不断地会有新的网络信息及新知识、新事物和新科学的出现,网络信息体系将是一个动态体系,因此自然地设置类目不需要刻意去打造一些可能出现的新名词、新事物。只要在设计时在技术处理和管理上保证其充分的扩容空间即可 。 


3.3 系统性、技术化原则 


作为网络信息分类体系需充分利用计算机操作环境与超文本、超链接技术,建构多维的分类体系,揭示多维知识空间的联系。具体来说,可以运用超文本的立体性来表现分类法的类目横向关系,利用超文本技术把类与类、类与纪录链接起来,自由链接、转换,形成整个体系的整体性、系统性。 


3.4 针对性原则 


在整个网络分类体系中不可能按相同的标准设类,并按相同的标准来类分下面的子类目。有时分类体系为了方便用户查找,专门将频率极高的事物和类目单独列出,有针对性地进行类分,并为充分反映该类目,使用有针对性的标准。比如搜狐将娱乐休闲放在所有大类中的首位,并将个人主页作为一个大类单独列出,新浪则没有专门设置为娱乐休闲而是设置生活空间、影视音乐、旅游休闲等等。当然有针对性原则并非对每类事物、主题都有极强的针对性,在网络信息分类体系设计过程中就某些主题、类目应有适度的针对性标准。 


 


参考文献:



<<上一记录 下载显示的记录 打印显示的记录 推荐给你的朋友 下一记录>>

 

 湘ICP备000012  版权所有:湖南图书馆