计算与检索方法
计算与检索方法(精选八篇)
计算与检索方法 篇1
1 计算机检索工具的类型和功能
1.1 计算机检索工具的类型
按检索资源的类型, 可分为两大类:即非web资源检索工具和w eb资源检索工具。
1.1.1 非w eb资源检索工具
非web资源检索工具是以FTP、Telnet、Gopher等为检索对象。
(1) FTP类的检索工具这是一种实时的联机检索工具, 用户首先要登陆到对方的计算机, 登陆后即可以进行文献搜索及文献传输有关的操作。使用FTP几乎可以传输任何类型的文件。在这类检索工具中, Archie是最常用的。Archie是自动标题检索软件, 它借助于FTP来访问。用户只需告诉其要检索文件名的有关信息便可获得文件所在的主机名、路径。与一般检索工具不同的是, 它不用主题来实现相应的检索, 而只能根据文件名和目录名进行检索。
(2) Telnet类的检索工具它指的是借助远程登陆 (remote login) 在网络通信协议Telnet (Telecommunication network Protocol) 的支持下, 在远程计算机上登陆, 使自己的计算机暂时成为远程计算机的终端, 进而可以实时访问, 使用远程计算机中对外开放的资源。例如HYTELNET就是用于Telnet信息资源的检索工具之一。它以超文本形式分门别类的汇集并罗列了数量相当多的Telnet信息资源, 在远程登录后, 对方系统往往设有专门的检索型工具, 以方便用户查找和利用。
(3) 基于菜单式的检索工具这类检索工具是一种分布式信息查询工具, 它将用户的请求自动转换成FTP或Telnet命令, 在一级一级的菜单引导下, 用户可以选取自己感兴趣的信息资源。这对于不熟悉网络资源、网络地址和查询命令的用户是十分简便的方法。在这类检索工具中最常见的是Veronica和Jughead。如Veronica用于检索Gopher菜单访问的信息资源, 是与Gopher配套的检索工具。它根据用户给出的检索词进行检索, 可检索文件名、目录名、文档及其他信息资源。
1.1.2 w eb资源检索工具
w eb信息资源是指建立在超文本、超媒体技术基础上, 集文本、图形、图像、声音为一体, 并以直观的图形用户界面展现和提供信息的网络资源形式, 与之对应的web检索工具多种多样, 大体分为三类:目录式检索工具、搜索引擎、元搜索引擎。
1.2 计算机信息检索工具的功能
网络检索工具的功能非常强大, 关键词检索 (Keyword) 是最基本功能, 包括以下几个方面:
1.2.1 布尔逻辑检索
布尔检索在网络信息资源检索中使用的相当广泛, 常用的布尔逻辑算符有4种:逻辑或、逻辑与、逻辑非、逻辑异或。检索中使用逻辑算符是最频繁的, 对逻辑算符使用的技巧决定检索结果的满意程度。
1.2.2 词组检索
词组检索是将一个词组或短语作为一个独立运算单元, 进行严格匹配以提高检索的精度和准确度, 通过使用逗号、双引号和括号进行检索。逗号的作用类似于OR。双引号的作用就是把引号内的关键词的组合当作一个字符串看待, 然后进行检索。括号的作用与数学的括号相一致, 使括号内的操作符先起作用。
1.2.3 字段检索
字段检索是一种用于限定提问关键词在数据库记录中出现的区域, 控制检索结果的相关性, 提高检索效果的手段, 多以字段限定方式实现。搜索引擎常用的字段有:Ti2tle/t、Subject、Text、bost、URL/u、domain等。
1.2.4 截词检索
为提高查全率而设计, 绝大多数网络检索都支持这一功能, 有的是自动截词, 有的是条件截词, 尤其在西文检索工具中更是广泛使用。截词检索可分为后截、前截、中截3种类型。不同的系统所使用的截词符也不同, 常用的有“?”、“*”、“|S”等, 因此截词检索也称为通配符检索。
1.2.5 位置检索
位置检索是指允许指定两个单词之间的词序和词距的检索。词序指单词之间前后顺序, 词距指两个单词之间间隔单词数, 其操作符多为“NEAR”。每个支持位置检索的搜索引擎对NEAR操作的字段间隔数的设置是不同的, 有的设置在25个单词之内。
1.2.6 概念检索
概念检索是指使用某一检索提问词进行检索时, 能同时对该词的同义词、近义词、广义词、狭义词同样进行检索, 以达到扩大检索, 避免漏检的目的。
2 计算机信息检索工具的应用实例———搜索引擎
互联网技术迅速普及, 应用到了人们生活的各个方面, 不仅改变了人们生活方式和思维方式, 更方便了全球信息资源共享。全球目前的网页超过已经超过一百亿, 每天新增加的网页数多达百万, 如果在如此巨大的数据资料库中寻找信息, 就像“大海捞针”一样, 作为互联网第二大核心技术的搜索引擎可以使我们在不到一秒钟的时间就迅速找到我们想要的内容, 它已成为人们在网络信息海洋中自如冲浪必不可少的利器。
2.1 搜索引擎的发展搜索引擎的祖先是1990年由蒙特利尔M cGill大学学生Alan Emtage等几人发明的Archie。
虽然当时万维网还未出现, 但因为当时网络主要用途是传输文件, 网络中的文件传输还是相当频繁, 由于大量的文件散布在各个分散的FTP主机中, 查询起来非常不便。因此Alan Emtage想到了开发一个可以以文件名查找文件的系统, 于是便有了Archie。
1994年4月, 斯坦福大学的两名博士生David filo和美籍华人杨致远共同创办了超级目录索引Yahoo!, Yahoo!向世人展示了网页分类搜索的超凡魅力, 数据库中的记录都是通过Yahoo!专家们精挑细选的, 所以通过它独特的检索方式和优质的信息成功地使搜索引擎的概念深入人心, 从此搜索引擎进入了高速发展时期。
1998年, 斯坦福大学的两位博士生Larry page和Sergey brin开发出了现在世界上最大的搜索引擎—Google。通过对20多亿网页进行整理, Google可为世界各地的用户提供适需的搜索结果, 而且搜索时间通常不到半秒, 现在Google每天需要为世界各国用户提供1.5亿次查询服务。
2000年1月, 李彦宏与徐勇在北京中关村创立了百度公司。历经几年的高速发展后, 百度高居全球网站流量前八名的位置, 已经成为全球十大网站之一, 百度每天接受着超过一亿人次来自各个方面的内容检索请求, 中国数千万网民几乎每天使用一次百度。
2.2 搜索引擎的工作原理
简单的说, 搜索引擎是通过从互联网上提取的各个网站的信息来建立数据库, 检索与用户查询条件匹配的相关记录, 然后按一定的排列顺序将结果返回给用户。
根据搜索引擎提取数据的方法, 可将搜索引擎系统可以分为三大类:
2.2.1 目录式搜索引擎:
是一种网站级搜索引擎。目录式搜索引擎由分类专家将网络信息按照主题分类法或学科分类法分成若干个大类, 每个大类再细分为若干个小类。一般分类体系可以分三到五层, 也有些层数可多达十几层。由上向下、逐步细化。首先由程序自动搜集信息, 然后由编辑员查看信息, 人工形成信息摘要, 提供目录浏览服务和直接检索服务。每一层都分布有若干“链接点”, 选择任意一个, 就可沿此分支进入下一层, 直到检索出所需目标。由于目录式搜索引擎是半人工完成工作, 因此其搜索有极高的准确率, 缺点是增加较高的人工成本、更新速度慢、信息量少且新颖性不够。搜狐、新浪、网易就是这类搜索引擎的代表。
2.2.2 全文搜索引擎:
全文搜索引擎是利用Robot程序在网络间的爬行技术来完成主要的信息收集工作。搜索引擎主动派出“spider”定期爬行搜索, 一般为几天一次, 也有些网站会长达数十天一次, 对一定IP地址范围内的互联网网页进行检索, 发现新的网页后, 它会自动提取网站的信息和网址自动汇集到数据库, 作为该网络检索工具提供检索服务的基础。不同的搜索引擎的数据库的收录范围是不一样的, 但一般包括网站名称、标题、网址、网页的长度、相关的超文本链接、内容简介或摘要等。当用户提出查询要求时, 由搜索引擎负责代理用户在数据库中进行检索。该类搜索引擎的优点是信息量大、更新及时、不需要人工干预, 缺点检索结果冗余度, 大量无用信息使用户很难快速得到精准地结果。Google、百度就是这类搜索引擎的代表。
2.2.3 元搜索引擎:
这类搜索引擎没有自己的数据, 而是将多个搜索引擎集成在一起, 并提供一个统一的检索界面, 将一个检索提问同时发送给多个搜索引擎, 同时检索多个数据库, 再经过聚合、去重之后输出检索结果。多元搜索引擎是其优点是节省不同引擎花费的时间, 返回结果的信息量更大、更全, 缺点是由于不同搜索引擎的检索机制、所支持的检索算法、对提问式的解读等均不相同, 导致检索结果的准确性差。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等, 中文元搜索引擎中具代表性的有搜星搜索引擎。
2.3 搜索引擎的性能指标
2.3.1 收录范围:
首先是数据量的大小, 虽然数量多并不能确保检索质量也好, 但检索结果可能比较完整。就收录项目而言, 许多检索系统不仅收集一种资源, 有时还收录多种不同资源供用户选取, 收录项目越多对于检索就越方便。就索引深度而言, 有些系统是将全文建立索引, 有些则择其中部分信息建立, 索引深度越深就能越详尽。就新颖性及更新频率而言, 所收录的资源是否能够得到及时更新保证其新颖, 直接影响到检索结果的质量。就处理语言而言, 若检索系统能处理多种语言文字, 用户可以使用熟悉的语言进行检索, 得到与之相匹配的各种语言信息的结果一并列出, 也可以根据用户需求列出, 对检索品质有极大的提升。
2.3.2 检索功能:
检索方式:检索方式单一还是多样, 是否既可直接输入检索词查找, 又可进行分类浏览, 用于浏览查找的索引列表是否丰富、多样;是否既提供基本或简易检索模块, 供初学者及一般用户使用, 又提供各种形式的高级或复杂检索模块, 以方便用户进行组配检索和精确检索。
检索技术:所使用的检索技术是否先进、多样。如, 布尔检索、组配检索、截词检索、相关检索、引文检索等。
检索限定:对于所查信息是否有选择与限定的自由。如, 可否对不同的数据库、文档及可检字段, 包括关键词、题名、著者、文摘、全文及所有字段等进行选择与限定;可否对出版年代、文献类型、文献语种等进行自由选择与限定。检索字段越多, 检索途径就越多, 用户的选择就越多, 更便于检索, 有助于提高检全率和检准率。
2.3.3 检索效率:
较为广泛采用的信息检索指标以检全率与检准率为主, 系统的响应时间及联机容易程度也是要考虑的因素。
检全率是指对于一项检索, 实际检出的真正相关的文件数目与所有应该被检出的文件数目的比率。检准率是指检出的真正相关文件数与检出文件数之比。此二者的优点在于有明确定义的计算公式, 而且计算十分方便。缺点在于忽略了不同文件之间的差异而给予所有相关的文件同样的权重。
响应时间和联机容易程度受网络的传输速度、带宽、检索数据反馈量、访问时间、界面设计等多种因素影响。
2.4 搜索引擎的发展趋势
自从1994年第一批搜索引擎出现以来, 经过多年的发展, 搜索引擎功能越来越强大, 为用户提供的服务也越来越全面, 查询结果更精确, 其发展的趋势是更加人性化、个性化和智能化。中文搜索引擎提供的主要服务和发展趋势包括以下几个方面:
2.4.1 自然语言搜索技术
以自然语言理解技术为基础的新一代搜索引擎, 我们称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识层面, 对知识有一定的理解与处理能力, 能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。因而这种搜索引擎具有信息服务的智能化、人性化特征, 允许检索人员采用自然语言进行信息的检索, 为他们提供更方便、更确切的搜索服务。
2.4.2 多媒体搜索
随着互联网宽带技术的发展, 未来的互联网是多媒体数据的时代。开发出可查寻图像、声音、图片和电影的搜索引擎是一个新的方向。它包括基于描述的多媒体检索和基于内容的多媒体检索。基于描述的多媒体检索就是用一个关键词来描述所要查找的图片或是音乐。基于内容的多媒体检索就是用一些视觉特征来查找多媒体信息, 这些视觉特征包括颜色、形状、纹理等。
2.4.3 本地化搜索
搜索引擎的开发者都会以他们的母语为基础, 按他们的思维方式和观点搜集和检索资料, 对于全球不同语种及习惯的其他国家用户来说显然是不适合的。因此对网站内容的搜索要求上也就存在差异。搜索结果要符合当地用户的要求搜索引擎就必须本地化。Yahoo!、Google等公司不断推出各国、各地区的本地搜索网站, 搜索的本地化已经是势不可挡。
2.4.4 智能化搜索
信息资源与计算机信息检索 篇2
人类社会的发展离不开信息与信息管理,随着科技的发展,信息资源也变得越来越丰富多彩了。在现实生活中,人们都在自觉或不自觉地接收、传递、存储和利用信息。究竟什么是信息?该如何利用信息资源?这对现在的人们来说已经变得非常重要了。下面就信息资源和计算机检索信息谈一下心得体会。
一、信息资源
1、什么是信息
自信息的概念出现后,至今还没有形成一个统一的认识。但是,从我们用户的角度来说,信息就是经过加工处理的数据。信息的表示形式有多种多样,一般我们认为信息变现为四种形态,即数据、文本、声音和图像。
2、什么是信息资源
信息资源同信息一样,到目前也没有一个统一的定义。狭义的说,信息资源就是指信息及其载体,也就是经过加工处理的、对用户有用的数据。
广义上说,信息资源是把信息活动的各个要素都纳入到信息资源的范畴,强调系统的概念。包括:(1)信息及其载体;(2)信息采集、传输、加工、存储和利用的方法;(3)信息管理人员与技术。信息的生产者、信息和信息技术是信息资源的三要素,三者是相辅相成,是一个整体的概念,只有形成一个整体,才能显示出信息资源的价值。
二、计算机信息检索
1、什么是信息检索
什么是信息检索?笼统地说,信息检索就是指从任何信息集合中查找所需信息的活动、过程与方法。
从狭义来讲,是指利用检索工具查找文献的过程。从广义来讲,信息检索全程应包括信息存储与检索两方面的含义。存储是将信息按一定的方式有序的组织起来;检索是根据用户特定的需求将相关信息准确的提取出来。
2、信息检索的方式
信息检索的方式分为手工检索和机器检索。所谓手工检索就是以手工操作方式,利用检索工具书进行检索;机器检索是指以机械、机电、或电子化的方式,利用检索系统进行检索。现在主要指计算机信息检索。
3、什么是计算机信息检索 所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
4、如何利用计算机进行检索
随着计算机的发展,计算机中的信息资源变得越来越丰富,越来越复杂,如何利用计算机进行检索快速地赛选出对用户有用的信息,现在已经变得有为重要了。通常我们认为计算机信息检索一般有六大步骤:
(1)明确检索要求和检索目标(2)分析检索课题,确定检索词(3)检索词的扩展、选择和处理(4)数据库的选择
(5)检索策略构成和调整(6)输出格式和方式的选择
三、总结
计算与检索方法 篇3
关键词 高校图书馆 信息检索 服务功能
中图分类号:TP393.03 文献标识码:A
0 引言
图书馆的主要服务对象是读者,为读者提供高质量的信息服务是图书馆服务的目的之一。在当今信息爆炸的时代,信息在形式上、数量上都大幅增加,传统的图书馆服务模式,受到了强烈的冲击和挑战。去电子图书馆已成为人们的共识。随着计算机和通信等现代技术的发展,在电子设备的协助下,可最大限度地满足读者的信息需求。电子化的阅读与信息检索,已成为现代图书馆的新服务模式。由于任何一间图书馆,即使其电子程度再高,其文献信息量相对于整个社会的信息需求量而言也是非常有限的,不能满足所有读者的信息需求。因此,图书馆计算机检索服务是基于计算机网络,而为读者提供的搜索服务。大学图书馆是高等教育和科研的重要支柱,因此,在高校图书馆开展计算机检索信息服务,对高校的建设和发展有着十分重要的意义。
1 当前高校图书馆发挥信息检索服务的主要问题
当前大学图书馆信息检索服务功能所面临的问题众多,如图书资源利用效率问题,信息检索服务功能的利用效率有限。高校图书馆资源的开发和利用只停留在满足学校老师和学生获取信息,写学术文章、阅读等方面,在市场经济中还没有完全发挥作用。集中表现的问题有:
1.1 宣传工作力度不够
虽然在近几年大学图书馆有较大的信息优势,图书馆的信息较大。但是宣传的力度不够,影响力小,人们对于高校图书馆数据库的认知度还比较低。高校图书馆工作者大多只是定位于踏踏实实做好本职工作,缺乏宣传图书馆工作的意识,对自己的工作成果宣传较少,,从而影响了人们对高校图书馆的社会认知度。
1.2 馆藏资源相对匮乏
对于教师和学生,公共服务必须有丰富的资源作为后盾,图书馆的馆藏资源是影响信息检索服务功能的重要因素。虽然高校的图书馆资源相对丰富,但面对现代信息爆炸的社会环境而言,馆藏资源显得相对匮乏。
1.3 服务水平不高
目前,大多数图书馆的服务质量仍存在一些问题,主要表现为:一是服务形式单一。对于许多图书馆,对读者被动服务仍是主要形式,很少有高校结合图书馆中心的特点为读者提供周到、积极的服务,图书馆资料的查阅便捷、提高预订咨询效率等工作大多还没有真正有效的付诸实践。二是利用效率不高。由于宣传力度不够,大多采用手工检索控制,服务设施落后,一系列的问题导致图书馆利用效率不高。三是采编工作缺乏成效。大多数高校图书馆藏书工作为完成指定的任务而采用突击编辑的方式,会导致图书数据质量不高,实用性不强,从而导致图书馆资源利用效率低等问题。
2 高校图书馆发挥信息检索服务提高的主要方法
选择一个或多个检索系统,只是为联机检索提供了必要的基础。为使读者能够在网上搜索到图书馆的信息,应发挥咨询服务的作用,也应充分显示员工的素质和技能,制订高品质的检索策略和计划,以达到最佳的检索结果。
2.1 加强宣传工作力度
2.1.1 组织宣传活动
通过举办图书馆信息服务、宣传窗口、印刷图片、答题簿等方式丰富信息资源,促进与教师、学生等读者的互动。
2.1.2 利用网络等手段提高图书资料利用率
图书馆要充分开发网上资源,如利用图书馆网页开办电子资源库、网上图书馆、网上音频和视频等资源。通过网页发布新书通知和图书信息,以提高图书的利用率。
2.1.3 创办刊物,扩大影响
图书馆工作人员的根据实际的工作经验将工作感受、理论研究论文等文章整理成出版物出版,还可以设置新书籍目录,对收集的资料进行展示,开展书评活动、新书推荐等活动,扩大图书馆的影响,发挥图书馆的信息检索服务功能,服务于读者。
2.2 选好检索系统,丰富信息资源
目前,国内和国际联机检索系统比较普便,种类繁多,让人无所适从。对于高校图书馆,应根据发展需要,以满足高校读者为主要目标,合理地选择一个或多个检索系统,以确保正常的图书馆信息服务。为确保信息资源既实用、丰富,从以下的角度来选择检索系统:一是系统要注重高校的专业特点和广度。二是系统所含信息要具备新颖性和完整性。三是要注重检索系统的性能。使用人机界面友好、操作方便的检索系统。
2.3 加强人员素质,提高服务水平
作为计算机联机检索人员,应具备敏锐的信息意识,责任心强,具备优秀的服务能力。我们应该掌握文献检索的原理和技术,提高外语阅读和翻译能力,熟练使用计算机,可以处理一些简单的软件和硬件故障。对于信息检索人员,可通过不同形式的学习,以提高自身素质,注重巩固和加强检索实践。此外,图书馆也应该可以根据检索人员不同的专业,合理搭配工作人员,实现团队工作人员的互补,以提高整体团队的工作能力。
图书馆工作人员在接受检索请求时,应认真听取读者的需求,不明白的地方要了解清楚,直到完全理解搜索的主题意义,理解要检索内容的核心所在。然后根据这一主题,在与读者充分沟通的基础上开展信息检索工作。
3 结语
总之,在高校图书馆开展计算机在线搜索服务,有着广阔的前景,也是非常有意义的。高校图书馆应重视这项工作,使图书馆在计算机联机检索服务中发挥更大作用,收到更大的效益。
参考文献
[1] 郑重.信息时代高校名牌专业重点学科文献资源建设[J].情报杂志,2004,23(10): 108-109.
计算与检索方法 篇4
内蒙古地区的木本植物资源丰富,目前在野外进行木本植物分类与识别,专业人员也要不同程度的依靠区域《植物志》、《植物名录》和《植物检索表》等分类工具书,而非专业人员即使是利用工具书也难以正确的识别植物的种类。植物分类工具书已经成了从事植物分类工作的基本条件。但是,利用传统的植物志等工具书类记录方式对木本植物区系进行管理,已经是一种落后的、手工的、费时费力并且很不经济的管理方式,不仅携带不便,保护困难,易于损毁,很难实现共享和交流,并且也很难对新成果、新发现进行快速灵活检索和动态更新,更难以将多媒体技术和数学模型分析等现代科学技术手段应用到植物分类与识别之中。加上植物志这类工具书印刷册数很少,给使用者带来很大的困难。因此,本系统的设计能够给野外工作者及植物爱好者提供一种方便快捷的植物检索工具。
二、系统开发语言介绍
该系统使用Microsoft主推的C#语言完成,这种高级语言不仅继承了C/C++的高效与稳定,更拥有更强的稳定性;数据库方面使用了ACCESS 2003,这是一个轻量级的、适合小型系统使用的关系型数据库,支持标准的sql语句,拥有完整的开发套件,并且因为同是Microsoft公司的产品,兼容性也无可质疑。
本系统对运行环境的要求也十分低,大学中的各类计算机都可以轻松地完成部署,所以本系统是完全可行的。
三、系统概述
1、系统简介
内蒙古木本植物计算机辅助检索系统的构建主要目的是为了给使用者提供方便快捷的植物识别检索工具。主要是通过使用者所要鉴别的木本植物的生活型、根、茎、叶、花、果实等各特征数据在本系统内输入相应的检索条件,检索到相应的木本植物,而且能查看到相应木本植物的详细信息。如木本植物的中文种名、拉丁名、蒙名、所属科、属、种及科属种的描述,资源属性、生长自然区和行政区、生存环境等,还可以查看相应木本植物的图片信息。对于专业人士还可以直接通过选择所要检索植物的中文科名、属名或拉丁科名、属名,也可以直接输入木本植物的中文种名或拉丁种名,检索到植物的详细信息。系统还包括木本植物的系统管理,也就是以便需要新增木本植物生活型、根、茎、叶、花、果实等各特征信息的数据,或是相应木本植物的详细信息描述,都可以通过相应的界面进行添加。
2、总体结构建立
该系统主要包括以下几个模块的内容:系统管理,查询检索,系统维护,帮助等。其中系统管理包含植物详细信息管理和植物项目属性管理,查询检索包括植物详细信息查询和植物特征信息查询两种检索方式,系统维护包括系统的密码修改、背景切换、皮肤切换、字体大小修改等,帮助模块主要是详细介绍了系统的使用。
四、系统各模块详细内容
1、系统管理模块
1.1植物详细信息管理
这个内容主要是对数据库中的木本植物的详细信息进行维护管理,包括植物的生活型、根、茎、叶、花、果实等,还包括植物的图片信息,可以对相应的内容进行添加、修改和删除。
1.2检索项目、属性管理
该模块主要是对植物的生活型、根、茎、叶、花、果实等相应的选择项进行维护,可以添加、修改或删除,如:叶子的叶序新加入一种以前系统里没有的,那么就可以通过该模块相应的操作进行添加。还可以对各特征信息对应的平面形状、立体形状、毛绒数据、颜色数据、顶端数据或基部数据相应项进行管理,如:叶子的平面新增一种形状,点击平面形状进行添加。
2、查询检索模块
2.1植物详细信息查询
植物详细信息查询主要是使用者可以通过选择植物的中文科名、中文属名、拉丁科名、拉丁属名或输入中文种名、拉丁种名来检索木本植物的详细信息。几个选项可以单选,也可以选择多个,这样可以使结果更精确化。本模块对于对木本植物非常了解的用户使用较方便。可以轻松的检索到想要查找的木本植物的详细信息。
2.2植物特征信息查询
植物特征信息查询是本系统的最重要的部分,主要是通过提取木本植物的生活型、根、茎、叶、花、果实等特征信息在植物特征信息查询界面中的"项目检索"中进行对应的选择,来检索到相应的木本植物,同时可以同时选择"属性检索"界面中的"毛绒数据"、"叶片形状"、"叶片颜色"等信息或是"量化检索"检索界面中的"高度"、"刺的长度"、"叶片长度"等量化数据。这些信息可以单独选择,也可以多项选择以增加检索木本植物的精确度。"属性检索"中的选择项和"量化检索"中的选择项可以在"项目检索"界面中的已确认检索属性列表框中进行显示,以帮助用户检查除了"项目检索"中的选择项,"属性检索"和"量化检索"中的选择项是否对应于自己多个选择,避免检索错误。例如:我要检索"生活型"是乔木、阔叶、落叶并且高度是达到4米的木本植物,那么在"项目检索"和"量化检索"中选择之后,点击查找得到相应的植物,然后可以通过查看详细信息进行人工的精细识别,得到最终想要查找的木本植物。
3、系统维护模块
系统维护模块主要是包括对系统进入界面、植物详细信息管理、检索项目属性管理的密码的修改,以保证系统信息的安全性。主界面皮肤及背景的切换,字体大小的修改,达到美观的效果。
4、帮助模块
帮主模块主要是对本系统的使用进行一个详细的说明,对初次使用本系统的人给予指导,能够让使用者很快了解本系统的操作及了解本系统的作用。
五、本系统的特点
对于植物的检索达到方便快捷,界面友好,功能强大,不仅适用于植物学、地理学、生态学等相关专业的人士使用,也适用于植物爱好者及其他对木本植物进行研究的人士。
六、讨论
内蒙古木本植物计算机辅助检索系统的构建基本达到阶段性和预期的目标,但是由于本人水平有限,还存在或多或少的问题,希望能与同行进行广泛交流,更加完善该软件。
参考文献
[1]田洪阵.基于web技术的植物检索信息系统的设计与实现.2006
[2]侯铜.基于叶片外形特征的植物识别的研究.2009
[3]高华.我国沿海常见浮游植物检索数据库的建立.2006
[4]石红.新疆高等植物检索和资源查询系统的研建.2006
[5]顾振华.园林植物识别的策略和方法.2008
[6]高润梅.山西农业大学植物园木本植物检索表.2006
[7]高树森.植物检索和查询技术的建立.2002
计算与检索方法 篇5
1 高校信息检索课教学现状分析
早在1984 年, 我国教育部就明确要求各大高校全面推进文献检索课程的建设, 1998年, 国家进一步出台了《关于高校本科学科目录和专业介绍》, 明确指出高校必须培养学生的文献检索、资料查询能力。如今, 信息检索课在我国高校的推行已经三十多年, 也取得了极大的成效。
虽然如此, 高校信息检索课程教学中依然存在很多问题, 主要体现在如下方面: (1) 校领导对于这门课程并未给予足够的重视, 导致教师在教学中不用心, 不注重教学思路、方法的创新, 致使这门课程教学质量并不理想; (2) 师资队伍建设有待加强。当前很多信息检索课教师的业务能力并不高, 信息素质也亟待提升, 更别提提高教学实效性了; (3) 教学方法单一, 很多教师仍采用传统教学方法, 学生学习兴趣难以提上来, 参与教学活动的积极性受挫, 因而学习效果不佳; (4) 很多教师仍存在着重理论教学、轻实践教学等情况, 这不利于提升学生的专业技能与操作水平。为了解决此类问题, 更好地推进高校信息检索课程教学改革, 必须加快转变教学理念, 创新教学方法, 注重加强实践教学, 以便全面提升学生的信息素质。
2 高校信息检索课程教学方法创新思路
2.1 转变传统教学理念, 对信息检索课程的重要性给予足够的认识
对于学校领导而言, 应认识到这门课程的重要性, 认识到该课程教学直接关系着学生信息素质的培养与素质教育改革的全面推进, 并注重动员全校师生, 加强该课程的认识, 使师生能够全身心投入教、学中来, 促进教学观念的转变及教学方法的创新。不仅如此, 对于教育工作者而言, 必须牢牢树立“以学生为本”的思想观念, 摒弃传统教学思路、方法, 进一步加强学习、培训, 全面提升自己的业务能力与综合素质, 以便更好地开展教学工作。此外, 教师应加强与学生的沟通、交流, 将教学创新思路、实施方案等与学生进行讨论、沟通, 争取学生的支持、配合, 在师生共同的配合下, 全面促进信息检索课程教学实效性的提升。
2.2 构建交互式教学模式
在如今这个知识经济时代, 高校信息检索课程传统教学模式已经难以适应时代的要求, 在现实化教学活动中, 单一化的知识传承已经无法有效提升学生信息素养, 也无法实现学生综合能力的培养。因此, 必须加快构建实战性、互动性、合作性交互式教学模式。将传统的教师为中心的教学模式, 转变为以学生为主体的教学模式, 全面提升学生发现问题、分析问题、解决问题的能力。在交互式教学模式下, 师生之间通过互动, 引导、启发学生自主提升自我信息收集、整合、应用能力, 生生之间通过互动、讨论, 互相碰撞思想火花, 实现相互提升的效果。具体而言, 教师应结合这门课程的具体特点及学生实际情况, 充分利用课堂时间, 牢牢吸引学生注意力, 采用合作、互动教学方法。可将学生分为不同的团队, 布置相应的任务, 使学生通过小组互动找到解决途径, 使每位学生都能参与任务, 教师将权利下放给学生, 学生自主讨论、完成教学任务, 并通过实习、作业等加以巩固提升。对于教师而言, 应注重倾听学生意见、问题、建议等, 调整教学方法、思路, 结合学生最为关注的热点, 了解学生的疑难问题, 并引导学生加以解决。教师可以通过问卷调研、邮件、论坛、个别谈话等, 将学生所感兴趣的课题进行征集, 开设课题, 提高学生兴趣。
2.3 注重拓展在“解决问题中得到学习”的教学方法
在具体开展教学活动中, 部分学生对于该课程的学习兴趣并不大, 这主要是由于理论讲授较为枯燥、乏味, 很多内容、实例缺乏足够的实用性, 因而, 要求教师必须逐步拓展在“解决问题中得到学习”的方法。在教学准备中, 精心设计问题, 紧密根据问题的解决, 引导学生开展学习, 同时, 增强理论教学的针对性, 融入多种案例、实例, 使教学活动更加生动、有趣, 同时, 注重增强实践教学, 可以在实践活动中渗入理论教学, 这样也能达到良好的效果。在课程教学开始, 应对某些问题、提问等进行精心设计, 鼓励学生就所需知识提出自己独到的问题、见解等, 不仅激发了其好奇心, 还增强了其理解、分析、解决问题的能力。在此过程中, 教师充当着设计者、指导者的角色, 所设计问题必须能够反映关键知识点内容, 并考虑到学生的经验, 注重实现新、旧知识的联系、融合。学生在合作交互式学习中, 与组员分享自己所思考、探索的结果, 对自己探索的方法进行阐述, 同时倾听和借鉴他人好的思路, 达到共同进步的目的。
3 结束语
对于高校教育工作者而言, 必须加强与学校图书馆、电教、计算机、信息中心等部门的联系, 与其保持紧密的合作, 同时, 不断转变思路、创新教学方法, 加强实践教学, 提高学生的参与积极性, 这样才能切实提升我国大学生的信息素养, 才能为我国社会主义建设源源不断地输出现代化应用型人才。
摘要:随着信息时代的到来, 各大高校顺应时代要求纷纷开设了信息检索课程, 以便提高大学生的信息素质, 为国家、社会培养现代化优秀人才。但应注意的是, 当前高校信息检索课程教学现状并不十分理想, 很多教师仍秉承传统教学理念, 采用传统教学方法开展教学活动, 导致大学生学习积极性不高、实践参与效果不佳。为了解决这一问题, 必须加快高校信息检索课程教学方法创新, 树立“以学生为本”的教学理念, 提高教学实效性。鉴于此, 本文结合我国高校信息检索课程教学现状, 就信息检索课程教学方法创新提出了若干思路和方法, 以供参考。
关键词:高校,信息检索课程,教学方法,创新
参考文献
[1]马志伟.兴趣——目标教学法:网络环境卜信息检索课教学模式初探[J].江西图书馆学刊, 2010, 23 (03) :230-233.
计算与检索方法 篇6
目前古籍数据库都具有强大快捷的全文检索功能, 它们的检索系统为用户提供了浏览检索、分类检索、条件检索、书名检索和全文检索等, 这些功能极大地满足了用户的需要;同时, 用户通过数据库的检索, 揭示古籍数据库所蕴含的深度信息, 并将其组织起来形成用户需要的立体的、图文并茂的知识。因此本文从数据库的检索角度, 分析当前古籍数据库的检索方式, 并以此为依据, 探讨古籍数据库深入检索的可能性。下面以文渊阁《四库全书》为例, 对现行的古籍数据库的检索功能进行分析。通行的计算机古籍检索方法可分为两类:标引方法和附带文本文件方法。而文渊阁《四库全书》全文数据库提供检索主页、分类检索、进阶检索三种检索途径[2]。
1.检索主页。检索主页是一种快速检索, 为读者提供简单快捷的检索界面。本人认为这一检索界面适用于主题明确, 但材料分散在《四库全书》的各部、类、属中。例如, 查关于我国古代儒家的代表人物荀子的资料。
2.分类检索。分类检索是为读者提供的浏览检索界面。它是按照四库分类法, 将书目按经、史、子、集四部划分, 每部分类, 类下有属, 属下即书名, 共四十四类、七十属, 见下表 (表1、表2) 。这要求读者非常了解四库分类法, 而且对所查书目的部、类、属的归属非常明确。使用“分类检索”的读者可以最直接地找到所需文献。
3.系统进阶检索。进阶检索是精确检索, 也是高级检索, 要求检索目的明确, 熟悉四库分类法及书目。该检索包括全文检索、书名检索、著者检索, 其中全文检索又有两种形式。熟练掌握高级检索方法是从海量古籍数据中查全、查准的必要条件。
(1) 全文检索的简单检索形式。检索目标明确, 在同一部、类、属, 同一书名, 同一著者等限定检索条件下, 对一个检索字符串在“正文”、“注释”中进行检索, 它的检索精确到某部书目或某一著者。而“检索主页”中“正文”、“注释”检索, 它的范围是检索整个数据库。
例子:查《东坡词》中“但愿人长久, 千里共婵娟”诗词出处。
分析:上述例子包含两个条件:检索字符串为“但愿人长久千里共婵娟”, 限定检索范围为“东坡词”, 读者可以通过进阶检索中的简单检索对文献进行查找。
检索步骤:点击进阶检索, 选择检索类型为全文检索, 检索字符串为“但愿人长久千里共婵娟”;检索范围选择“正文”, 四库分类为集部词曲类词集之属, 条件为“东坡词”。检索结果:共1条, 1个匹配。
(2) 全文检索的高级检索形式。即布尔检索, 利用布尔逻辑运算, 通过逻辑组配进行的检索, 是一种精确检索。它的检索条件与上述检索形式的限定检索条件相同, 但提供两个或两个以上检索字符串, 通过“与 (and) ”、“或 (or) ”、“非 (not) ”三种形式组配后的检索[3]。
例如:查关于李将军、李广在司马迁著《史记》中的记载。
分析:在史记中有许多关于李广将军的记录材料, 名称有“李广”, 也有“李将军”, 为了检索准确全面, 可以利用全文检索高级检索的“与”“或”、“非”进行检索。
“与”检索步骤:点击进阶检索的全文检索, 选择高级检索, 检索字符串为“李广”、“李将军”, 四库分类为史部正史, 书名条件为“史记”, 作者为“司马迁”, 组配符选择“与”。检索结果是文献中同时包含检索词“李将军”和检索词“李广”的文献同时命中。“与”检索结果:共4条, 25个匹配。
“或”检索步骤:检索字符串与检索条件相同, 组配符选择“或”。检索结果是文献中包含检索词“李将军”的文献或包含检索词“李广”的文献或同时包含检索词“李将军”和检索词“李广”的文献同时命中。“或”检索结果:共10条, 37个匹配。
“非”检索步骤:检索字符串与检索条件相同, 组配符选择“非”。检索结果表示包含检索词“李将军”同时不包含检索词“李广”的文献同时命中。“非”检索结果:共3条, 3个匹配。
从“与”、“或”、“非”检索结果范围看是不一样的, 数据命中结果也不相同。这样检索的结果更精确。
(3) 充分利用进阶检索与多数据库联合检索提高查全率和查准率。在古籍检索中, 为了提高查全率和查准率, 还需要掌握一些技巧, 如当检索异写字时, 我们可以利用数据库提供的“关联字查询”, 找到与之相对应的异体字、繁简字、古今字、通假字、正讹字、形近字等, 提高检索的准确率;当古籍的文句出现异文时, 把全部词语作为一个字符串查找, 必定与数据库中的文本不一致, 检索结果自然为空, 这时应该采取化整为零的检索手段, 逐步减少检索词, 每次只检索很少的几个字, 以排除出现的歧异, 提高检索的命中率;当检索某主题的资料时, 要利用关键词语反复查询, 以便从不同方面获取有关的信息, 提高查全率, 例如查询人物时, 可以从姓名、字号、别称、籍贯, 甚至事迹等不同方面取关键词多次检索, 以免遗漏重要的资料。
查找成语出处时, 尤其要注意检索方式, 因为许多成语并不是作为一个连续的字符串出现在典源文献中。例如查找“杯弓蛇影”的出处时, 在数据库中直接查找“杯弓蛇影”并无所得。这时可以试用《国学宝典》数据库的多条件检索, 查“杯”和“蛇”同时出现的段落, 立刻可以找到《晋书·乐广传》有这个故事。
此外, 目前几个大型古籍数据库收入的古籍各不相同, 文本形式和检索功能也有差异。为了检索更有成效, 联合使用几个不同的数据库, 往往可以弥补单一数据库的不足之处。
古籍数据库具有强大的检索功能, 为读者在检索中提供了纵向的历史线索和横向的当代线索, 它的重要性会被越来越多的读者所认识。希望借助它的强大检索功能, 对研究中国古代文明的读者提供丰富的资料, 同时体现古籍数据库在学术研究方面的重要作用。
随着计算机技术和信息技术的发展, 新兴的技术 (如古籍数据库的文本分析功能) 会越来越多地运用到古籍数据库系统中:通过对电子文本文件进行多种参数分析, 统计字词出现的次数和频率;分析字词的使用情况和语句的结构特征, 开展古籍计量学的研究;通过对古籍文本的语言文字分析反映文献的行文措词特点, 进而形成古汉语语料库, 通过建设古汉语语料库, 实现历史文献资源的共享, 促进古籍研究的发展。
在古籍检索方面, 在字词检索的基础上发展为智能检索, 利用智能型实现主题检索, 如我们要研究某种文化现象或某种思想的起源和演变时, 只需作主题检索即可实现。但是主题检索与计算机的人工智能研究, 特别是跟计算机的自然语言理解和知识的形式化表示有密切联系, 目前还难以实现。如果利用现有的数据库作主题检索, 我们只能拟定若干关键词, 反复迂回地在数据库中作字词检索, 从中筛选出需要的资料。
一个完善的古籍数据库系统还应该提供给检索者在页面图像上任意标定检索样本, 不受检索点的限制的方案;检索样本直接出自页面图像, 毋须顾及同一性判定、字符集规模、通假字、词库等问题, 具有较高的自动化程度。
摘要:本文以文渊阁《四库全书》数据库的检索系统为例, 对古籍数据库的检索方法进行了较为详细的介绍, 并设计了若干检索样例, 配以图表来帮助读者充分利用资源, 提高利用率。最后对系统的发展提出了自己的建议。
关键词:古籍数据库,检索方法,进接检索
参考文献
[1]郑永晓.古籍数字化对学术的影响[J].社科管理与评论, 2006 (4) .
[2]《文渊阁四库全书内联版》使用说明.[2007-3-26]http://211.81.31.51/scripts/skinet.dll?OnLoginPage
[3]布尔逻辑检索.[2007-3-26]http://gdy.gdmc.edu.cn/library/distanced/luoji.htm运算次序
计算与检索方法 篇7
在我国大部分本科高校, 文献检索这门课主要是为大四的学生开设的一门课程, 它是一门综合图书馆学、情报学、计算机网络技能为一体的方法课与技能课。它是根据时代环境, 以提升个人信息领悟, 信息意识, 信息能力为目的的一种培养模式, 也是提高大学生信息素质的主要途径和主要方式, 学这门课的目的和宗旨在于培养学生发现信息, 掌握信息并如何去利用信息的能力。当然, 光掌握这些还不够, 毕竟, 信息检索课的终极目的是将信息检索的理论和实践相结合, 与此同时, 还必须让学生领悟到如何利用这些信息去加工处理, 之后要从中筛选, 并和自己所要查询的知识相匹配, 相呼应, 相吻合。可以这样说, 文献检索这门课程为学生的再教育比如研究深造以及将来从事的工作都打下了非常重要的基础, 这门课程在整个大学四年的课程里面占的价值比例都非常大, 它是一门具备重要意义的基础课, 它占的地位不容忽视。因此, 掌握了文献检索的精髓与技能, 也就必将具备了一种综合的, 在未来大环境具备独特作用的基本素质和独特能力。通过文献检索课程的教学过程中遇到的问题和教学反思及学生的反馈情况, 本人积累了几点最切身实际的体会。接下来围绕如何将文献检索这门课程的教学质量有效提升展开几点论述。
一、课前准备
课前准备包括教材内容的梳理以及和实际相关联的内容的选材。在上课的时候, 需要教师用生动、易懂的语言将教材上的内容以教师自身的理解, 体会和延伸讲解给学生。备课这项工作是需要花费时间和精力的, 备课应从以下几方面入手。首先, 熟知教材的构架。通常, 教师在备课之前, 会浏览一下本教材的目录及各部分章节大概内容, 在大概了解和掌握了教材的基本结构和基本内容之后, 也就是大概掌握了教材的框架的基础, 我们也会做到心中有数了, 哪部分是需要删减可以不做讲解的, 哪部分还需要增加相应内容, 让学生有必要在教材之外学习到的, 也就是说, 我们应该做到心中有数, 我们要明确该讲授的内容了。当然, 没有一本教材是全面到适合所有院校所有学生, 我们要确定我们选定的这个教材的优点和可鉴之处, 也要发现本教材的缺点和不足之处, 这就需要教师在这方面多加用心, 在教授这本课的时候, 要根据本学校大纲和要求, 结合本教材进行自己关于这门课程的理解和准备。取其精华, 弃之糟粕, 增加教师认为既实用又有价值的东西, 这才是好教师应该具备的品质和能力。有一部分同学在上课之前都会有预习这个好习惯, 教师可以在第一节课上课之前简单介绍本教材的概况, 以及本教师要讲述的章节和删掉的章节以及增加的章节, 在每节课上课之前也最好提前告诉学生下节课要讲述的章节以及学生需要准备哪些内容的相关的知识, 让学生做到心中有数, 预习的内容有侧重点, 提前预习的时间没白花费。因此, 明确了解了哪部分是本教材的重要内容和基本掌握技能, 哪部分是教师着重讲述的, 进而以本教材为基本点, 进行取舍, 让学生心中有数。其次, 紧跟时代步伐。这需要教师用心观察, 用心准备, 为课程积极适当添加调料。在课前准备正在发生的时事新闻供同学了解, 这可根据所教授的学生的专业背景来搜集案例, 内容呈现多样化。比如可介绍当前热门的新技术、新媒体、专业热点或是考研信息等使学生感兴趣的话题, 这种话题很多很多, 相对于纯粹的理论知识, 学生对于这些话题更感兴趣。给同学介绍这些, 可以让他们体验到搜索信息所带来的新奇, 这一点做好了非常重要。为什么这么说?不要认为教师了解的信息, 学生都听过, 事实上, 有一部分同学很多新奇事物未必听过, 经过教师的讲解和引导, 学生会对此感兴趣, 兴趣是最好的老师, 学生感兴趣了会进一步自发查阅, 而非仅仅局限于课本的基础理论, 将文献检索应用于实际, 才是它最大的价值所在。最后, 要针对不同的专业背景设置内容。本人认为这一点尤为重要, 也最关键, 最突显文献检索的价值所在。有一部分同学在毕业之后是继续学业, 读研究生的, 那么在本专业领域掌握相关技能对于以后的学习无疑是个重要的铺垫, 学生会感谢他们在本科所学的这门课程, 我们作为这门课程的教师的价值就体现在此, 在讲解的过程中根据专业侧重点, 要用到不同的检索工具和不同的授课重点, 这样更具备专业性, 针对性, 实用性。比如可以给学生介绍学生所在专业的科学领域所用到的几大数据库, 每个数据库收录文章的特点, 以及科学人员的创新成果, 引导学生主动去关注这些科研人员的科学研究以及他们所研究方向的研究动向及最新进展, 这就为他们去主动学习数据库的检索奠定了基础, 提高了文献检索课的学习热情, 培养学生的信息敏感性, 也就提升了文献检索课的教学效果, 从而突出其专业特色。
二、师生互动
现在大多数高校里上文献检索这门课程都是通过多媒体教学的形式来实现的, 利用多媒体, 教师进行讲解及现场演示。现场演示主要包括将内容提纲、数据、图片及实例等通过PPT进行展示出来, 通过这样的演示可以使学生将检索步骤清晰化。我们学校的这门文献检索课程是在机房上课, 教师在主机上将搜索步骤进行一步步演示, 每位学生的电脑可同步展示其教师演示的操作画面, 这种课堂效果使得此门课程的教学变得更加生动化, 形象化。学生一目了然, 具体的完整的了解了搜索的过程。这样, 就做到了授课和实践不分离, 教师可边讲理论边做演示操作, 需要注意的是, 操作过程不要太快, 学生刚刚开始接触文献检索也需要慢慢接受的过程, 因此要求教师在操作演示的过程中一定要慢, 边操作边让学生吸收, 这样, 学生的印象才会深刻, 这样才使同学们更易清楚的理解, 更容易吸收。因此, 有条件的学校在机房上文献检索课程可大大提升教学质量。另外, 教师可以随机为学生布置习题, 让学生自行操练, 做到随讲随练, 有问题在课堂上及时为学生指出, 将知识及时消化, 加深学生对于信息检索的理解。此外, 别忽视了课间十分钟的作用。总有一部分同学, 课间不去活动, 教师可走下讲台去和学生互动, 在这个时候, 有的学生就会利用这个时间和机会去和教师进行一些交流, 解决了可能自己即使费时费力但是也想不通的问题。当然, 教师也要主动对学生掌握情况进行询问, 在他们自行操练的过程中, 就要下台来回走动, 观看他们检索的过程是否存在问题, 教师也要做到主动发现他们身上存在的问题, 更好地提高学生学习的积极性和学习热情。师生互动对于任何一门学科都适用, 尤其对于我们这门文献检索课显得尤为重要, 因为本身这门课就是一门实操课, 在机房上课又有这个互动条件, 这就充分体现了以学生为主体的教学, 可以大大提高学生的动手能力与想象能力。
以上说的是课上的互动, 那么课下的互动通常可以通过布置作业来检验。我们学校这门课程使用的这本教材是陈英主编的《科技信息检索》[1], 教材中的每一章节缺乏思考题, 为了解决这个问题, 教师需要在此多下工夫, 参与编写与设计有价值的思考题, 便于同学们思考和完成。不是上完课就完成了任务, 布置什么样的作业与思考题体现了一个教师的用心程度和能力水平。那么通过布置作业来发现问题, 在上课的时候进行有针对性的讲解, 这是通过课下的时间来消化课上学到的知识, 这也是教学过程中的不可缺少的一个关键环节, 它是对本门课程的学习情况进行的一个检验。
三、技能考核
技能测试体现在最后的课程考核上。有关这门课程的考核, 高校与高校之间是存在差异的, 有的高校是依然采用纸质试卷的形式为主来进行考核的, 这种考试最明显的缺点是体现不出学生的信息检索技巧, 看不出学生实际掌握检索过程的能力。文献检索这门课程是实践性很强的一门课程, 它可以直接体现学生的检索操作能力, 因此, 考核学生的动手操作能力应视为考核的重点, 卷面考试作为一个传统的考试方法, 其实对于文献检索这门学科不太实用, 无法全面直观反映出学生技能的掌握情况。我们大可不必什么考试都采取传统的卷面考试的形式, 我们对于这门课程的考核方法是采用总评成绩等于平时成绩和技能操作成绩的总和, 那么平时成绩是包含出勤情况, 课堂讨论和平时作业, 那么这部分占总成绩的30%, 剩余的70%为技能操作成绩。这样不仅避免了学生死记硬背, 而且还使得这门课的实际应用得到了发挥, 也就达到了我们学习这门课程的意义, 这才是学生真正要学习到的精髓所在。
四、结束语
高等院校开设文献检索这门课程, 对提高学生的信息意识和信息素养, 培养大学生探寻、分辨、获取文献信息的能力, 以及提高学习能力、想象能力和科研能力, 为大学毕业后接触新环境后的再教育和工作都起到了非常关键的作用。有效提高文献检索课的教学质量, 就要充分体现“以学生为主体”的教学思想, 同时要以学生的专业背景为依托, 以学生相应专业背景下的专业热点及实时事例为主线来进行生动教学。与此同时, 教师还要不断提高自身的业务素质和教学水平, 不断摸索, 不断积累, 在教学模式和形式上不断创新和改革, 使其课堂形象化、直观化、效果好、反馈好, 这样才是我们教学需要达到的效果, 这样能更好的适应现代教学, 更好的迎合学生发展的需要, 激发学生自主学习的兴趣, 使文献检索课的价值发挥至最大。
摘要:随着计算机网络技术的发展, 检索手段在文献检索工作中变得更为重要, 也对高校文献检索课的教学质量要求更高, 它要求教师将文献检索课的理论与实践很好的结合, 遵循教学原则的同时抓好实践, 提升教学质量, 将文献检索课的价值与应用充分发挥出来。
关键词:文献检索,提升,教学质量
参考文献
计算与检索方法 篇8
关键词:学生综合素质评价与检索,模糊聚类,特征加权
1 引言
目前, 随着国家在各级学校对学生综合素质培养的重视和相关政策的贯彻执行, 不再单纯以考试分数定高低评价学生个体的成绩和班级、学校及区域的教学质量成为未来的发展趋势.而学生综合素质的发展特点、水平和潜在可能性存在较大差异, 为了促进每位学生的综合素质的可持续发展, 教育主管部门有必要对学校或区域 (区、市、省) 学生的各方面综合素质数据加以综合分析和评价, 从而发现隐藏在背后的信息, 给出对学校或区域学生综合素质培养具有科学指导性的意见.而面对越来越庞大的学生数据, 教育部门难以只是简单地根据学生的成绩数据分布找出规律, 并由此进行决策.在这种情况下, 采用模糊聚类分析方法[1,2]、演化方法[3]、数据挖掘方法[4]等用于发现素质教育的状况并采取相应的措施用于素质教育, 全方位提高教育质量, 突出培养创新人才有着重要的意义.
以上方法中, 基于模糊聚类分析方法的综合素质评价是最有效的方法之一, 该方法的基本思想是依模糊聚类原理, 将综合素质相近的学生归属到某一类别中, 从而达到对学生个体或教育机构的学生全体的综合素质进行评价.但文献[1,2]提出的基于模糊关系的聚类方法只能对用具体分数给出的素质特征进行评价, 而学生的部分素质特征很难用具体分数进行量化, 如道德品质、能力素质、创新能力等.这些素质更适合用评语评价, 因此文献中的方法具有一定的局限性.
为解决以上模糊聚类方法对学生综合素质评价的不足, 本文提出了基于模糊K-原型聚类的综合素质评价和检索方法, 旨在增强学生综合素质评价的客观性和公平性, 使学生或学校能通过评价系统充分认识自身不足, 进一步完善自我.也可以从中明确教育重点, 加强学校整体建设, 推动教育事业的发展, 达到学生和学校的双赢.本文第2节对目前综合素质评价的不足进行了分析和对基于综合素质的检索进行了介绍, 第3节提出了基于模糊K-原型聚类的评价和检索方法, 第4节给出了实验结果, 第5节总结全文并对未来的发展方向进行了展望.
2 背景
提高学生综合素质成为目前教育部门和民众关注的热点问题之一.例如很多地方的初中和高中不再单纯将升学率作为评价学校教育教学质量的唯一手段, 还将学生综合素质评价作为一项重要指标.通常综合素质评价指标体系中有德育素质、智育素质、体育素质和能力素质4项, 其具体评价标准细则是教育部门根据本校或本地区具体情况制定的.通常单个学生综合素质评价得分计算公式为:综合素质总积分=德育素质积分×权值1+智育素质积分×权值2+体育素质积分×权值3+能力素质积分×权值4.学习成绩为期末考试成绩加权平均值, 其他3项也按评价标准进行了量化, 学校总的综合素质分数取算术平均值.
学生对现行的综合评价方法普遍有些不满, 主要焦点集中在评价标准的量化问题.针对个人的责任和义务、思想和品行, 仅仅用一个极为具体的分数来界定, 难免有失公平, 人性化得不到很好的体现, 能力和思想品德的成绩应该是模糊的.当前的评价方法不仅不利于提高学生的综合素质, 而且使测评工作也失去了导向作用, 容易使学生陷入以分数为中心, 从而迷失了自己的人生价值.
通过调研发现现行评价制度存在诸多不合理方面:
1) 评价内容结构不合理.
多数学校的学生综合素质评价体系的具体内容划分为德、智、体、美、实践等几个方面, 但操作过程中更强调对智的考查, 忽视了对学生其他重要方面 (如实践能力、创新能力等) 的评价, 使得评价的重点不符合人才培养的目标和要求.
2) 评价手段简单, 标准划分不确定.
目前多数学校学生评价操作过程为自评、互评、班团委评定及学生管理机构最终认定, 导致测评中片面性和主观性的问题十分突出.另外分数设置不合理, 如基本分和加分问题等.
另外在对某个项目加分时, 标准划分具有不确定性.如积极参加体育锻炼是否可以成为一个体育爱好者与坚持体育锻炼的普通同学之间的评判标准?再如, 关心同学、热爱集体等内容如何划定, 如何判断应加的分值?
针对以上不足, 目前不少学校已经在酝酿改进评价办法, 避免把一切东西都量化成分数, 逐步采用具有描述性、评价性的语言, 即评语来对学生某些方面不易量化的综合素质进行较为合理的评价, 另外采用分类别和等级的办法对学生个体或总体的综合素质进行评价.
3) 不易实现综合素质的检索.
在某学生集合中, 检索符合某一综合素质条件的学生较困难.如有某择优的需求, 在某区初中某年级的8000名学生中检索出数学、语文、外语成绩均在95分左右、物理和化学成绩均在90分左右, 体育和德育素质均是良以上的最符合的学生, 且给出的权值分别0.2, 0.2, 0.2, 0.15, 0.15, 0.05和0.05.这是一典型的模糊检索问题, 目前的综合素质检索系统很难支持这样的检索.
3 基于模糊聚类的评价与检索方法
3.1 聚类分析
聚类分析[5]是多元统计分析的方法之一, 是统计模式识别中非监督模式分类的重要分支, 其任务是把一个未标记的样本集按某种准则划分成若干子集, 把相似的样本归为一类, 而不相似的样本归在不同的类.为了与本文提出的评价方法描述一致, 以下的描述用S={s1, s2, …, sn}表示样本集.聚类的数学描述如下:设S={s1, s2, …, sn}是待聚类分析的样本集合, S中每个样本si (1≤i≤n) 用有限个参数值来刻划, 某个参数值表示si的某个特征, 于是si可以用向量p (si) = (si1, si2, …, sim) 来表示, 其中sij (1≤j≤m) 是si在第j个特征上的值, p (si) 称为si的特征向量.聚类分析就是按照样本间的距离关系把s1, s2, …, sn划分成K个不相交的模式子集S1, S2, …, Sk, 即满足下列条件
undefined
其中样本sj (1≤j≤n) 对类Si (1≤i≤K) 的隶属关系可用隶属函数表示为
undefined
3.2 模糊K-原型聚类算法
根据样本在聚类中的积聚规则以及应用这些规则的方法, 聚类算法大致可分为层次聚类算法、划分式聚类算法、基于密度和网格的聚类算法和其他聚类算法[6].实际当中应用较广和证明最有效的是划分式聚类中基于目标函数的模糊K-均值算法 (FKM) .由于模糊K-均值算法只能处理数值型数据, 而传统的将类属型转化为数值的方法不是总能得到有效的结果, 因为类属型数据是无序的.Huang在1997年提出了一种与K-均值类似的K-原型算法[5], 该算法能对具有数值和类属特征的混合型数据进行聚类, 通过不断更新聚类原型来达到优化目标函数, 获得最优聚类的效果.当样本集中同时具有数值和类属混合数据时, 每个样本的特征向量用si= (sundefined, …, sundefined, sundefined, …, sundefined) 表示, 则混合类型样本si和sj间的相异性测度d (·) 定义为
undefined
上式右侧第1项是数值特征上的欧氏距离的平方, 第2项是类属特征上的相异性测度δ (·) , 定义为
undefined
权值λ用来调节两种特征在目标函数中的比例.对于混合类型的样本, 聚类的目标函数为
undefined
公式 (2) 中的μij在上式中转化为μij∈[0, 1], 其中α∈[1, +∞) , 实际中经常取α=2.pi=[pi1, pi2, …, pim]T表示第i类的原型.
K-原型算法的运算代价是O ( (b+1) ×K×n) , 其中n是样本数, K是类别数, b是再分配过程循环次数, 通常K, b≪n, 该算法对大数据集聚类非常有效.
3.3 学生综合素质数据的描述
不同阶段学生综合素质评价的内容不同.以初中为例, 可以评价学生综合素质的指标大致可分为主要课程成绩 (语文、数学、外语、物理、化学、地理、历史、政治等) 、文艺、美术、体育、道德思想、综合能力、实践能力、创新能力等.虽然指标众多, 但可将指标分为如下两类, 数值型指标和评语指标 (与以上的类属型指标含义相同) .其中数值型指标是可以通过考试而获得的成绩指标, 而评语指标是不容易量化的指标, 如道德思想、综合能力、实践能力、创新能力等, 这些除了可用量化等级指标如优秀、良好、及格等评价机制外, 用综合评语评价近年来成为主要趋势.综合评语能明确指出学生的优缺点, 不像分数评价容易打击学生的自信心.不同时期, 不同学生群体指标的权值不同, 即评价标准不同.在中国目前的教育体制下, 初中和高中阶段, 数值型指标的权值所占比例较高, 而在大学以上阶段, 可以考虑将评语指标权值比例提高.
为了对学生的综合素质的数据进行描述, 这里假设某个学生有m种素质指标, 将某学生si上的所有指标用向量si= (si1, si2, …, sim) 表示, 则S={s1, s2, …, sn}是某机构所有学生的集合, 构成m维的学生向量空间, 其中si的数值型指标用sundefined, sundefined, …, sundefined表示, 评语指标用sundefined, sundefined, …, sundefined表示, 与以上模糊K-原型聚类的描述相同.
由于不同层次的教育机构对si中各维指标的关心程度不同, 即对综合素质的贡献率不同, 本文提出采用特征加权模糊K-原型聚类算法[7]对学生的指标数据进行聚类, 相应的用以下公式 (6) 和 (7) 分别代替公式 (3) 和 (5) , 并令α=2, 得到特征加权模糊K-原型聚类算法, 这里的权值是由用户给出的.
undefined
3.4 综合素质的评价与检索方法
基于以上的特征加权模糊K-原型聚类算法, 本文采用如下思路进行学生综合素质的评价与检索:
1) 根据学生综合素质各维数值指标和评语指标, 采用特征加权模糊K-原型聚类算法将综合素质相似的学生聚集在一起, 得到每名学生所归属的类簇, 即得到对学生个体综合素质的评价.
2) 求出每个学生类簇中的学生数和指标特征均值.
3) 确定与检索请求指标特征值最相似的类簇.
4) 在此类簇查找满足检索请求的最适合学生.
方法的描述如下:
步骤1 输入学生综合素质数据集合S={s1, s2, …, sn}和权值λl (l=1, 2, …, m) 和分类数K和检索请求sr.
步骤2 用特征加权模糊K-原型聚类算法将综合素质相似的学生聚类在一起, 得到K个学生类簇, 令s=1.
步骤3 假设第s个类簇中学生的数目是d个, 由以下公式求出第s个类簇中所有学生综合素质指标属性特征均值As, 若s
undefined
步骤4 由以下公式, 求出检索请求sr的数值指标特征值.
undefined
步骤5 令s=1, 求得Ars=|Ar-As|, 若s
步骤6 令Min{Ar1, Ar2, …, ArK}=Arc, 由此确定与Ar最相似的类簇C.假设C类簇中有d个学生, 由以下公式求得集合
undefined
步骤7 令Min (V) =vj, 由此确定的学生sj即为最符合检索请求的学生.
4 实验
为了对以上提出的评价和检索方法进行评价与对比, 需考虑影响方法的性能参数.这些性能参数主要有学生数量、划分数K、检索请求权值、原型初值等.由于学生综合素质检索与按照关键字相等的普通检索目标不同, 是一满足检索请求的综合性能最优模糊检索.本文借鉴信息检索中经常采用的衡量查找性能的两个个指标, 查全率 (Recall) 、查准率 (Precision) 来评价方法的性能.由于查全率和查准率根据不同的问题表现为不同的形式, 这里的查全率表示为undefined, 其中d是以上查找算法步骤6中第一次确定的类簇C中学生的数目, n是所有学生的数目, 查全率反映了第一次查找时定位到的类簇中学生数目占学生总数的比例.查准率表示为undefined, 其中m是执行n次查找时得到最优结果的次数, 反映的是算法的精确度.以上3个指标中, 查准率对体现学生综合素质检索性能是最重要的, 因为高的查准率能直接提高检索精度.查全率对查找性能的影响是间接的, 这里不作探讨.
为了研究方法中不同K值和学生数目对查准率的影响, 我们以某区初二学生的综合素质数据作为样本, 在PC机实现了以上检索方法并设计实验进行了性能分析.PC机的硬件配置是Intel Pentium双核CPU, 主频为2.5G, 内存2G.软件环境为Windows XP SP2操作系统, 检索方法的实现由C语言开发.为了分析不同学生数目和不同K值对查准率的影响, 我们分别对K=10, 20, 30和学生数目分别为2000, 4000, 6000这几种情况下的查准率进行了比较和分析, 结果分别如图1和图2所示.从图1可以看出, 随着学生数目的增加, 查准率下降并不明显, 表明查准率对学生数目的变化具有鲁棒性.图2是在学生数目为2000而改变K值时, 查准率的变化情况.从图2可以看出, 在一定范围内增大K值能提高查准率, 但在某个点后, 随着K值的增大, 查准率反而下降, 表明查找算法对K值是敏感的, 在实际当中需根据经验确定K值.
5 结束语
本文提出了用特征加权模糊K-原型聚类算法来解决数值型和评语型并存的学生综合素质评价和检索问题.该方法通过将学生综合素质归属到某一类别中, 避免了原有用分数评价的武断性.另外实验表明, 检索方法能显著提高学生综合素质检索的查准率和提高查找的鲁棒性.本文提出的方法解决了原有基于聚类分析方法对学生综合素质评价的不足和不能有效检索混合型的学生综合素质数据.下一步的工作将在本文的基础上, 研究样本分布、用户检索请求权值等对查准率的影响.
参考文献
[1]王文正.基于模糊聚类分析的简单学生考核方法[J].滨州职业学院学报, 2009, 6 (2) :27-30.
[2]张秀梅, 王涛.模糊聚类分析方法在学生成绩评价中的应用[J].渤海大学学报:自然科学版, 2007, 28 (2) :169-172.
[3]李晖, 张金隆, 唐勤.基于演化算法的大学生综合素质评价系统[J].数学的实践和认识, 2007, 37 (19) :31-36.
[4]王登.数据挖掘技术及其在高校素质教育应用中的探讨[J].现代电子技术, 2007, (4) :95-97.
[5]李洁.基于自然计算的模糊聚类新算法研究[D].西安:西安电子科技大学, 2004.
[6]孙吉贵, 刘杰, 赵连宇.聚类算法研究[J].软件学报, 2008, 19 (1) :48-61.
注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com
相关知识
计算与检索方法
中文期刊全文数据库检索方法与技巧
信息检索ISI
检索字段符课件
别拿检索不当干粮啊 这些技巧你都会?
锌肥与磷肥配合施用防治人参缺锌花叶病的方法
如果分别以检索词 a、b、c在某数据库的关键词字段进行检索都能得到相应的检索结果
检索课堂第二期:中文文献检索不到?几招助你熟能生巧
尝试基于一列来执行数学计算
辰山植物分类学课题组出版《上海维管植物检索表》
网址: 计算与检索方法 https://www.huajiangbk.com/newsview104850.html
上一篇: 与心理不健康有关的人口学因素包括 |
下一篇: Python机器学习基础教程 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039