搜索
您的当前位置:首页正文

浅论网络信息检索

来源:小奈知识网
科技信J_L OIT论坛o 2009年第3l期 浅论网络信息检索 沈 扬 (常州工程职业技术学院 江苏常州213000) 【摘 要】信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。基于Int∞net的网 络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 【关键词】网络信息;信息检索;搜索引擎 1.网络信息检索简介 信息是现代社会的宝贵资源,随着社会的发展进步,信息的价值 2.2.2目录索引 目录索引虽然有搜索功能,但不能称为真正的搜索引擎,只是按 将不断飚升。正如世界著名未来学家阿尔温・托夫勒预言:“谁掌握了 目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需 信息,控制了网络,谁就掌握了整个世界。” 要的信息,不依靠关键词进行查询。目录索引中最具代表性的是 Intemet是当今世界上规模最大、覆盖面最广、信息资源最丰富、 Yahoo、新浪分类目录搜索。 2.2.3元搜索引擎 发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论 对研究人员还是一般用户来说,都有着很强的现实性和实用性 元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索, 1.I信息检索概念 并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile等。中 信息检索是指将信息按一定的方式组织和存储起来,并根据信息 文元搜索引擎中具代表性的是搜星搜索引擎。 用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式 2.3搜索引擎的技巧 2.3.1关键词的选择 主要有:(I)传统的信息检索方法,通过人工查询在图书馆等提供文献 的机构进行文献的查询和获取活动;(2)联机信息检索相对于前者来 说具有实时性、完整性、共享性、广泛性等优点;(3)网络信息检索是指 通过网络信息检索工具检索存在于Intemet信息空间中各种类型的网 络信息资源。 1.2网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用 的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几 种方式。 目前搜索引擎不具备智能识别能力,往往不能很好地把握用户到 底想要什么,只会在现成的数据库索引中查找相匹配的关键词。因此, 选择合适的关键词是成功检索的第一步。 (1)使用特定词汇。有时输入的关键词由于过泛而没有被收录在 搜索引擎的数据库索引中,这时可以选择与该主题相关且更具体的词 汇。例如,欲搜索某些期刊的投稿电子信箱,一般策略是在搜索框内输 入“xxx杂志编辑部”,对知名度高、信息化程度高的期刊而言,一般都 能搜出相应的email,可信息化程度不高的期刊就比较难。此时可以尝 l-2.1布尔逻辑模型:用户可以根据检索项在文档中的布尔逻辑 试如下两种方法提高搜索效率:①同时输入两个关键词。缩小检索范 关系提交查询。搜索工具根据事先建立的倒排文档结构确定查询结 围,即“x)口【杂志email”或“x】。【杂志电子信箱”;②关键词中加入电子信 D【x杂志@”。 果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关, 箱关键信息,即“】要么与查询无关。利用这种模型进行查询.其查询结果一般没有按照 内容的相关特性排序。 1.2.2模糊逻辑模型:在查询结果处理中引进了模糊逻辑比较,并 使用同义关键词和关联关键词来检索,以达到更全面的搜索结果。 2.3.2局限于某个具体网站或者网站频道 且按照相关的优先次序排列查询结果.这样就可以克服布尔逻辑模型 (2)使用多个含义相近的关键词。对于热门信息来说,搜索时犯愁 的是返回条目太多,可对冷门事件或事物来说往往恰恰相反。此时可 许多单位都会针对同~热门事件在本单位网站发大量文件或文 信息查询结果的无序性。 章。这些文章或文件往往名称相同但具体内容和要求却不同 此时,指 1.2.3概率模型:它是基于贝叶斯概率原理而提出的,根据词条、 文档间韵内在联系。利用词条间和词条与文档间的概率相依性来进行 定网站或频道的搜索功能能为我们提高搜索效率。 2.3.3按文件类型查找 信息检索。 如需要查找简历模版时可以构建如下检索式:“简历模版filetype: 2.搜索引擎 iletype:do ̄是限定检 搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联 doc”.此时能搜到word格式的简历模版。此处的f网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系 索文件的类型。该字段必须在英文状态下录入,而“简历模版”是检索  统。它主要是用于检索网站、网址、文献信息等内容。随着网络技术的 的关键词。两个字段之间必须用空格隔开。发展,各种搜索引擎层出不穷,目前流行的搜索引擎主要是帮助用户 搜索表层信息,如目0og 、百度、雅虎等。 2.1搜索引擎的工作原理 2.1.1数据采集标引机制按照一定规律和方式对网络上www站点 3。网络信息检索的局限 3.1文本信息检索的局限 3.I_1网络信息标引的准确度不够 当用户要进行特定的文献检索时,有时还会发现现存的检索工具 进行搜索,并将搜索到的www页面信息存人搜索引擎的临时数据库 无济于事,检索出来的数据完全被无用信息所覆盖。如想要通过搜索 引擎查询清朝雍正年间李卫任浙江巡抚的资料,你只能够查到大量 中。 2.1.2数据组织据组织机制的主要功能是对WWW页面信息进行整 理以形成规范的页面索引。并建立相应的索引数据库。 2.1.3索引数据库是用户进行检索的基础,它的数据质量直接影 响到检索效果.而搜索引擎的数据采集标和标引机制又是决定数据库 质量的关键技术。 2.2搜索引擎的分类 2.2.1全文索引 《李卫当官》之类无用信息。 3.1.2搜索引擎的查全率不高 由于互联网上的信息资源以爆炸性的速度不断增长,搜索引擎采 集数据的速度远远落后于信息资源的增长速度。单个搜索引擎的数据 库所收集的Web页面大大不足,就是所有的搜索引擎所储存的数据 也只占全球Web页面的50 ̄6强。 3.1-3搜索引擎的查准率不高 一是返回的信息过多.这是现有搜索引擎检索信息的普遍现象; 自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人” 二是返回重复的信息,搜索引擎的检索结果中还经常重复出现同一信  (Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调 息源的不同部分.甚至出现不同信息源的相同内容信息。3.2多媒体信息检索的局限 用;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜 3.2.1检索效果不够理想:目前,几乎所有的多媒f下转第100页) 索结果。 根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有 科技信息 0机械与电子0 2009年第31期 下020以下火石玻璃选用200/230,王冕170/200;qb20以上中等尺寸 透镜粒度选择为170/200;大透镜或需手修的零件,粒度选择可到140/ 170 由此可以看出.此产品为中径q521,要选的磨轮粒度为1701200 的磨轮.铣磨机的型号根据现有的生产条件在这里选用的是YG367 铣磨机。 5I2.3聚氨脂泡沫塑料抛光材料:主要用于中等精度大批量生产 5I3常用的抛光粉 (1)三氧化二铁(红粉)(2)铈一稀土氧化物(3)氧化锆抛光粉} 4.精磨 4.1精磨的目的 精磨。是铣磨和抛光中间的一道工序,这道工序的目的是: 4.1.1通过精磨使工件表面凹凸层深度减小; 4.1.2进一步改善工件表面的曲率半径精度和平面度。 下面先分析一下精磨完工尺寸和铣磨有什么不同: 5.4抛光基体模工装设计 5.4.1凹抛光模的设计 必须先知道曲率半径和口径,由公式得: Rr=Ro-t0.8(凹取“一”凸取“+”) 因为抛光模设计出来后还需帖上一层聚氨脂片,其厚度为 0.8mm。 Dp=2Do 假设抛光模口径取2倍玻璃直径,根据以上公式代人数据得: R Ro+0.8=32.96+0.8=33.76mm Dr=2Do=2x22.6=45.2ram 所以(抛光模基体模凹模子)的曲率半径为33.76ram,口径为 45.2mm。 5.4.2凸模子的设计 与凹模子设计方法一样由公式得:Rr,=Ro-' ̄0.8此时为凸模子,所以 取“一” Rv=122.46—0.8=121.66mm Dp=2Do=2x22.6---45.2mm 图2精磨完工图 其口径和凹模子相等,都为 5.2ram 5:5抛光对磨模的工装设计 抛光对磨模上根据抛光基体模的尺寸而设计出来的,它是将抛光 由图不难算出D值仍是 22.6和粗磨完工图尺寸一样,只有凸凹 基体模在无意中磨损或变形后进行修正的作用,要修正凹凸两个抛光  ・ 两面的曲率半径有改动,粗磨时为R33.06,精磨后为R32.96;粗磨时 基体模也就应该有两个相对的抛光对磨模。为R122.36,而精磨后就为R122.46。由此可以推算出: =5.5.1凸抛光对磨模:必须先算出口径和曲率半径: Dm=l1DP Rc±O.1 所以要使工件达到这一精度要求,就必须设计出相应的精磨模。 4.2精磨模的尺寸计算及设计 4.2.1凹精磨模的设计:要设计出精磨模就必须知道其模子的口 径 和半径R, (1.7-2)Do 而曲率半径只需用粗磨模曲率半径+金刚石丸片厚度即可,金刚 所以曲率半径就应该取凹抛光基体模的曲率半径: Dm=1.1x45.2=49.72ram 因此凸抛光对磨模的口径为49.72mm,而曲率半径则为33.76ram 5.5_2凹抛光对磨模 曲率半径取凸抛光基体模的衄率半径R121.66mm,而口径则为: Dm=0.9DP 石丸片一般为3mm~5mm,在这里可取值为4mm,所以:Rj.=Ro+4,通过 以上两个公式可以算出: (1.7~2)Do=2x22.6=45.2mm 而Rim=Ro+4=33.06+4=37.06 所以此抛光对磨模的曲率半径为121.66ram,而口径则为: Dr,o=0.9x45.2=40.68ram 因此凹抛光对磨模的口径为40.68ram,而曲率半径则为 121.66ram 由以上数据就可以画出凹精磨基体模。 4.2.2凸精磨模的设计:必须知道D 和半径R D/m=(1.7~2),在此取2倍D。所以就有: Dim=qb22.6x2= 45.2ram Ri ̄=122.06-4=1 18.06 6.结束语 总之,单件高效生产能提高大批量光学零件加工的效率,缩短了 加工时间.减少或省去了辅助工序。各道工序及辅料的特征优越在于, 精密压型毛坯代替块料毛坯;金刚石磨轮的粗磨铣削和金刚石磨具的 高速精磨代替散粒磨料的粗磨和精磨:聚氨酯抛光模的高速抛光代替 由D 和 就可以画出相应的模具了。 古典法抛光;高效的氧化铈抛光粉代替红检;刚性装夹代替弹性装夹。 这样一来就 以大幅度地提高生产效率。 5.抛光工艺及工装设计 5.1抛光机理 【参考文献】 对于抛光机理,很早就引起了人们的重视,但目前为止还没有形 [1]蔡立.光学零件加工技术【M】.北京:兵器工业出版社,2006年. 成一个完整的统一的理论,正待于人们进一步探讨。总体来说抛光过 光学冷加工工艺手itS[M].北京:机械工业出版社,1991年 程是一个机械、物理、化学的综合过程,机械是基本的作用,化学是重 [2]吕茂钰.要的作用,而流变现象又始终是存在的。 5.2目前国内常用的几种抛光材料 5.2.1柏油混合抛光材料:主要用于球面高速抛光 5.2.2古马隆混合抛光材料:主要用于平面抛光 [3]光学冷/Jn3:m'ge[c] ̄:ll:京:机械工业出版社,1988年. [4]刘树民.高精度棱镜的高效制造技术.光学技术,1999年. [责任编辑:张新雷] (上接第82页)体搜索引擎在多媒体信息的查准率方面都不能达到令 转换为可以执行检索的特征矢量、交互方式的设计,如何获取用户的 人满意的程度,用户将在返回的几百个甚至上千个图像中筛选需要的 内容感知等问题。目前的多媒体搜索引擎用户查询接口比较单一,大 那一幅。这是很费时和令人难以忍受的,而且有时你所用的搜索引擎 多只提供描述查询接口,即关键词提问框。 根本检不出你想要的东西。归其原因,一方面是在于查询方式的单一. 另外,目前基于内容的检索技术多应用于对静态图像的检索,对 另一方面在于对图像的标引深度不够,这就要求完善图像检索和索引 动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步 机制。 实现,动态多媒体信息在网络中将会越来越多。 3.2.2用户查询接口单一:理想的多媒体检索系统中,人是主动 的,用户的查询接口能提供丰富的交互能力,且直观易用,使用户能够 【责任编辑:王静] 在主动交互过程中通过调整检索参数,这就涉及到如何把用户的提问 109 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top