cmsDetail cmsDetail

机读主题标引的规范性分析

2011-08-24 最后更新
0阅读

[摘要] 本文就机读主题标引规范文献和现状的不利形势分析其原因并提出了一些建议和解决办法.

[关键词] 机读  主题标引  规范性

  主题标引于计算机提供了语言检索的功能之后在文献检索工作中显现出日益突出的地位。主题标引以其直观性、灵活性、易操作性从众多的检索方式中脱颖而出,在未来的文献检索领域愈来愈趋向于主导地位。然而基于语言的语法及逻辑性远比数字符号形式的分类语言难于表达,又由于计算机所能提供的标引空间相对有限,加之主题标引的机器规范模式又没有专门成文的标准文献可以依据,《中国机读目录通讯格式》中的主题分析块的纲领性框架以缺少典型事例的具体显示而难以遵循。综观文献数据库中的主题标引字段,其混乱程度难以描述,混乱状况简直不胜枚举。有鉴于此,笔者奋笔疾书,一是呼吁文献标准化部门的关注;一是根据笔者多年从事文献分编工作所积累的经验对机读主题标引领域做些有益的探索和中肯的分析,希望能在实际工作中发挥一点积极的作用和意义。

一 机读主题标引的现有规范形式。

1.机读主题标引的规范文献。机读主题标引的原理和方法来源于各种版本的主题法教材。主题词之间的具体表现形式来源于《中国机读目录通讯格式》。

2 .《中国机读目录通讯格式》规定主题标引分析块共分8个字段:个人名称主题,团体名称主题,家族名称主题,作者/题名主题,普通主题,地名主题,非控制主题。

3 .指示符。指示符用两个字符来表示,采用阿拉伯数字和空格的组合形式。

4 .子字段。不同的主题字段具有不同的子字段数量和内容。具体含义如下:@a主标目,@b副标目或辅助成分,@c副副标目及修饰语,@d会议届次,@e地点,@f时间,@g名称倒序部分,@h名称其它部分或分册号,@I分册名,@k出版日期,@l形式副标目,@m作品语种,@q版次,@t题名,@x主题复分,@y地区复分,@z年代复分。

二 现有机读主题标引的异象分析。

  普通主题以外的主题形式因其主题词的单一性而很少出现异议。普通主题因其主题因素的复杂性,子字段的逻辑性要求,主题标引人员的个性分析,其主题排列形式五花八门,众标不一,呈现出严重的不规范性。

1.专有名词主题字段。专有名词主题字段主要指以地名,人名,团体名称作主标目的主题字段。由于各个文献部门规定不一,标引人员理解不一致形成专有名词主题与普通主题重复使用的现象,造成主题标引的繁琐和计算机存储空间的浪费。地名主题比如:《中国地质研究》本来是专业问题研究,标入普通主题字段即可,但因其涉及“中国”这一地区复分主题词,个别标引人员便在地区复分主题字块重复反映。个人名称主题比如:《梁实秋文集》,内容横跨社会科学,只标成@a社会科学@x文集即可,根本不必再标出@a梁实秋@x文集。在主题法教材中明确规定文献名称中出现个人名称的文献,如果文献内容仅涉及个人的专业领域,要对文献从个人名称及专业内容两个方面进行双重标引;如果文献内容涉及多个学科领域仅用学科主题进行标引即可。团体名称主题比如:《中国先秦史研究会》并不是词表上的规范词但因其是专有名词有的单位把它标入团体名称主题字段。

2 .普通主题字段。普通主题字段的问题集中表现在@a@b@c中的主题词的逻辑性及@x的主题类别及在子字段中的排列顺序。比如《世界环境问题英语读物》会出现@a英语@b环境问题@x普及读物@y世界//@a环境问题@b英语@x普及读物@y世界两种不同的标引方式。问题出在按照逻辑性要求,“英语”应排在前面;按照本质重要性“环境问题”应排在前面。又如,《世界能源研究词典》按规则应标为@a能源@x研究@y世界@x词典。其中引起异议的是同属@x却分处两个位置。这是因为“研究”一词是普通主题复分,而“词典”一词是文献类型主题复分。而文献类型因素在手工标引模式中要标在所有主题词之后,所以参照手工标引规则“词典”一词要放在最后。那么又会由此产生一个派生问题,究竟什么样的词算作文献类型主题词,别的专业书籍曾涉及过这个问题,但机读主题标引格式中未见说明。且不说“汇编”“作品集”算否文献类型,最不可思议的是有时“研究”一词竟也堂而皇之地出现在文献类型这一位置。

3 .主题标引原则的理解与运用。

(1)单纯字面组配。在单一、专指主题标引与组配标引之间常常产生分歧。在对文献进行选词标引时,应首先选用与原文献主题概念相对应的、单个的和最专指的主题词进行标引。如果这种方法行不通,则应选用词表中与原文献主题概念最邻近、最直接相关的几个主题词进行组配标引。如《神经系统肿瘤》一书,从表面上看,显而易见可以选用“神经系统疾病”、“肿瘤”这两个主题词进行标引,但是如果细心留意主题词表,则可查到有“神经组织瘤”这一专指主题词,可直接用此词进行标引。前一种方法错就错在使用了形式词而非本质词,组配词而非专指词。在本质上同样能揭示相同的文献内容,但在形式上不符合规定。

(2)多标识组配。多标识组配是指一种文献可以使用多个不同的主题词进行多种形式的组配。从表面都可提示文献内容,但其中只有一种方式符合主题词组配原则。如《飞机结构设计》这一标题,如果“飞机”、“结构”、“设计”、“飞机结构”、“结构设计”这几个主题词同时存在话,进行轮排组配,可产生多种组配形式,但只有“飞机结构”、“结构设计”两词组配最符合标引原则。

(3)越级组配。所谓越级组配是指对一种文献进行标引时,用上位词代标下位词或用下位词代标上位词。如“经济危机”“金融危机”“货币危机”三词系属属分关系词,不能相互代标。

(4)二义性组配。二义性组配是指用两个相同主题词进行两种不同逻辑顺序的组合会产生两种不同意义的概念。如“图书馆”、“学校”两词,可以形成@a图书馆@b学校//@a学校@b图书馆两种不同的组配形式。,分别提示两个不同的概念。

4 .选词依据的混乱。原则上词表词都是合法的,都可以利用。但有的专业文献中就出于某种考虑而规定某些主题词禁止使用。比如词典,词典一般分单一文种和复合文种两种编排方式。本文侧重分析复合文种词典的标引。复合文种词典的标引,一般应从学科,词典,文种三方面进行标引。而在《主题法的理论与标引》(刘湘生编著)一书中,为了去掉概念上的重复,方便读者检索,“科技词典”、“专业词典”、“对照词典”三个主题词不予启用,一律规定采用“词典”一词标引。而没有读过此书或没有进行过专业学习的标引人员,就会标引出与规则不同的形式来。如:@a计算机@x词典@x英文,中文//@a计算机@x对照词典@x英文,中文的对比就可说明这一问题。

三 机读主题标引达到一致性、规范性的建议及措施。

  主题标引采用语言表现形式,必然要受到语言的语法和同义多种表达形式的制约。因而要达到一致性、规范性不是一件容易的事。又加之主题标引的主体是人所以有着极大的个性和主观色彩。另外,指导文献的缺乏及标引工作组织的失误等等使主题标引的一致性、规范性呈现出错综复杂、难以控制的局面。文献标准化主管部门及文献标引单位应针对上述出现的问题采取相应的措施,尽快提高主题标引质量,使主题标引尽可能趋于一致。

1.硬件措施。

(1)建议机读标引格式与主题法教材合二为一同步发行。在图书馆界,常规的工作方法是用到什么求购什么,很少从全局出发考虑专项工作的背景因素。在主题标引工作方面,《中国机读目录通讯格式》因其要对一条文献记录保证完整的描述,涉及主题标引的篇辐不可能很多,规定也不是很全面、细致。其概括性根本起不到指导具体标引工作的作用。而主题法教材因读者范围狭窄、发行数量小、发行时间难以掌握,给初学者带来及大的不便。针对这一问题,上级职能部门或文献工作的权威机构同编辑和出版发行个人或部门协商,使机读格式和主题法能同时与用户见面,使主题标引工作有据可依,给文献标引工作的质量控制创造方便条件。

(2)主题标引工作标准化。主题标引工作标准化是文献工作标准化的一个方面,是标引工作前后一致、多人一致的保证,也是主题标引成果共享的要求。主题标引标准化包括标引工具和标引规则标准化两个方面。目前使用的《中国分类主题词表》收词范围广、词型比较规范,是图书馆界普遍使用的权威主题标引工具。主题标引规则的标准化主要依赖于主题标引方法指导书以及机读主题标引格式的科学性、细致性、及时性、一致性。主题标引规则的制定一定要预先做好实践调查研究,针对文献内容日趋复杂化的倾向,各种可能产生分歧的现象都要尽可能用简明扼要的语言及符号加以界定和规范,健全主题标引规则,使所有主题标引工作都有章可循。同时,机读主题标引规则要参照主题标引方法指导书,主题标引方法指导书要适应机读主题的新特点。二者相互补充,彼此配合,最好二者能达成一体化,确保主题标引工作能方便地纳入标准化的轨道。

(3)主题标引工作手段自动化。工作手段自动化主要是指办公设备计算机化,计算机软件集成化。计算机的硬件设备较易普及,而软件集成化所能覆盖的领域还十分有限。目前计算机应用于图书馆分编业务领域还主要集在在后一部分的加工阶段。前一部分的著录工作可以利用机读目录格式,实现部分自动化。分类、主题还处于一片空白。这一部分也正是难以实现机读化的领域,在技术方面还没有达到成熟得足以向公众推出的地步。希望图书馆界的高科技精英们能急实际工作之所急,尽快给工作人员一个满意的答复。而这种未来的机读标引工具也将会给传统的分类、主题标引工作带来与以往的分标习惯相逆转的革命。这种革命具体体现在分类主题一体化不是首先从分类入口得到相关主题,而是首先从主题入口得到相关类号,实现主题同类号的链接,主题与分类的同步。其优越性在于使工作人员摆脱了抽象类号的寻找而达到自然语言的自由运用,使工作人员不必在分类—主题词、主题词—分类表交互利用之间浪费时间,而且最终由于机器的程式化、固定化使主题标引的结果更趋于规范化。

(4)机读主题标引工作网络化。图书馆网络分传统网络和现代网络两种。传统网络是不同地区、不同系统、不同等级的文献单位之间松散的、采用传统联系方式的系统组合。而现代网络用计算机技术和现代通信技术取代传统交流方式而在原有的传统网络基础上建立起来的。可以说,现代网络是传统网络的现代化。现代网络使主题标引工作摆脱了个人行为局限,通过各网点计算机的通信联接,每个工作人员都能通过计算机这种先进的媒体相互参考和分享彼此的标引成果,既加快了标引工作的速度,又可提高标引工作的质量,使标引工作更趋于规范,一致。

(5)加强主题标引工作制度建设,尽快健全、完善标引工作制度。其一,岗位责任制。岗位责任制是促使标引工作顺利开展,保证工作效率和质量的一项有效措施。通过岗位责任制规定标引工作质量要求与衡量标准,实行量化管理,明确其有把主题标引工作做好的义务,规定其对主题标引错误所要承担的责任。其二,奖惩制度。奖惩制度是一项联系标引数量和质量,对工作超额且质量高的人员给予一定的物质奖励和精神鼓励,对工作不力的人员给予一定的惩罚的一项切实可行的经济管理方法。通过奖惩制度的实施,形成一种鼓励先进、鞭策落后、多劳多得、好坏不一的工作机制,把标引质量和经济利益有机地结合起来,使标引质量得以迅速改观。其三, 检查制度。由于标引人员素质参差不齐加之标引工作的技术高难性与操作复杂性及工作人员思维方式的多样性,建立标引质量检查制度是十分必要的。主题标引检查制度是最具权威的一道工作环节,在标引规范性的提高上有着十分重要的地位。标引检查人员应由最精通图书馆业务且业务知识全面、标引工作经验丰富、有较高知识素养的业务骨干担任。且为了保证主题标引前后一致,应尽量避免中途换人,保持一定的连续性。

2 .软件措施。软件措施是指主题标引人员的素质教育和提高。主题标引规范性的软件措施主要由于标引人员的素质的无形性、主观性、因人而异性及难以规范性而造成人员素质提高的难度性而称其为软性。文明程度的提高,文献内容的复杂深奥使标引人员面临新的严峻挑战。拥有一纸文凭便想从一而终、不思进取的思想已经难以应付复杂的局面。只有标引人员的素质全面得到提高,标引人员都具有高智慧、高度科学性、善于分析和思考的头脑,主题标引的规范性才能达到最完美的境界。首先,加强标引人员的思想素质。那种认为标引工作仅仅是技术性强的业务工作的观念是完全错误的。标引工作也需要发挥人员的主观能动性。应努力培养标引人员,使其树立强烈的现任心,对工作认真负责、一丝不苟的敬业精神,摆脱标引工作是一种个人行为的狭隘观念,树立全局意识,充分意识到标引成果正确性的重大意义。多一分用心就会多一分发现。其次,加强业务素质教育。标引工作由精通业务,一专多能的复合型人才担任是最理想的。但由于学科教育造成个人知识结构单一,这种人才还很短缺,目前还不现实。标引人员素质的提高可以通过社会教育和自我教育两种途径得以实现。社会教育是指文献单位选派工作骨干到高校进一步深造及标引权威机构举办短期专业讲习班进行速成教育,针对性强、时间短、见效快。自我教育是指各种专科工作人员在实践工作中重新学习这一未知领域,逐渐达到能独立工作为止。再次,文化素质教育。标引人员不是掌握了业务知识便可一劳永逸地结束学习过程。标引人员的知识应随时代和文献的发展而不断地得到更新,与时代同步发展。标引人员应在业余时间里养成好学上进的习惯,注意学术发展动态,对新兴事物和新兴学科积极进行了解,掌握其本质属性,把自已培养成具有相当综合素质的复合型人才和业务骨干,推动主题标引工作规范化向更高水平迈进。

  机读主题标引格式随着标引界的普及使用已逐渐脱离新生事物的行列。但主题标引机读化还不完善,机读形式的主题标引工具还没有出台,主题标引在规范性方面还不尽人意。以上林林总总虽然暴露出主题标引领域的不足,但也显示出主题标引的广阔前景和进一完善的余地。主题标引的规范性相信在不久的将来,通过各界的努力,会形成一个新的可喜局面。