问答系统的设计与实现;.docx

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
问答系统 第PAGE1页 共49页 目录 TOC \o 1-3 \h \z \u 引 言 1 第一章 研究背景 2 1.1问答系统研究背景 2 1.2传统的问答系统的不足 2 1.3问答系统研究现状 2 1.4问答系统的类型区分 4 1.5问题的类型进行区分 4 1.6中文问答系统研究 5 1.7相关评测 5 第二章 系统分析 6 2.1市场调查 6 2.2问答系统的问题分析 6 2.3问题分类 6 2.4问题相似性判定 7 2.5关键词扩展 8 第三章 数据库设计 10 3.1数据库的需求分析 10 3.2数据库表结构设计 10 3.3E-R模型 12 第四章 系统详细设计与实现 15 4.1系统工作原理介绍 15 4.2系统数据流图 16 4.3系统的实现算法 16 4.4注册模块的设计与实现 19 4.5注册模块的设计与实现 32 4.6 系统首页的设计与实现 34 4.7用户提问模块的设计与实现 38 4.8问题显示模块的设计与实现 41 4.9问题回答模块的登录与实现 44 4.10后台管理模块的设计与实现 45 第五章 系统测试 47 第六章 总结 48 致谢 49 参考文献 50 引 言 问答系统的设计目标是用简治、准确的答案回答用户用自然语言提出的问题。在人工智能和自然语言处理领域,问答系统都有着较长的历史。1950年英国数学家图灵(A.M.Turin8)在论文“Computing Machinery and Intelligence”中形象地指出了什么是人工智能,以及机器应该达到的智能标准。也就是通过自然语言问答的方式,判断机器是否具有智能。20世纪70年代随着自然语言理解技术的发展,出现了第一个实现用普通英语与计算机对话的人机接口LUNAR,该系统是伍德(W.Woods)于1972年开发用来协助地质学家查找、比较和评价阿波罗一号飞船带回的月球岩石和土壤标本的化学分析数据的系统。 本文将简要介绍国内外问答系统研究的进展情况。并且针对问答系统中的一个难点以及实现方法进行了讨论。并给出如何识别用户搜索关键字的方法。 第一章 研究背景 1.1问答系统研究背景 随着因特网的快速发展,网络上流通的信息日益增加,它已俨然成为巨大的讯息流通交换平台,要在如此大量的数据库中找寻有用的数据着实不易,通常会藉助于搜索引擎的功能来达成,然而以关键词为主的搜索引擎常会找出所有相关的信息,但是其中也包含许多无用的数据,用户浪费很多时间浏览不相关的网页。 随着互联网的发展,网络已成为人们获取信息的重要手段。目前,世界上最大的搜索引擎Google能够搜索的网页数量已经超过了百亿。 传统的搜索引擎存在很多不足的地方,其中主要有三个方面: 一是以关键词的逻辑组合来表达检索需求 二是返回的相关性信息太多 三是以关键词为基础的索引,停留在语言的表层,而没有触及语义,因此检索效果很难进一步提高。 以上两点使得人们在互联网上的海量信息中快速准确地找到自己所需要的信息变得越来越困难。 1.2传统的问答系统的不足 传统的问答系统虽然可以对用户提出的问题给出确定的答案,但是这些问答系统的数据源是基于一个固定的文档集合,尚且不能满足用户的各种各样的需求。 利用互联网上的资源是有效的解决之道 互联网上具有丰富的信息,是问答系统数据源的理想资源,因此将问答系统与互联网结合起来,就变得非常必要。这也就促使了基于互联网的问答系统的出现和发展的问答系统的出现和发展。 1.3问答系统研究现状 问答系统的概念虽然提出的时间并不长,但已经形成发展出了一些比较成熟的系统。 美国麻省理工学院人工智能实验室于1993年开发出来的START,系统(/projects/infolab/start.html)是全世界第一个基于Internet的问答系统。START系统旨在为用户提供准确的信息,它能够回答数以百万的英语问题,主要包括与地点相关的问题(城市、国家、湖泊、天气、地图、人口统计学、政治和经济等)、与电影相关的问题(片名、演员和导演等)、与人物相关的问题(出生日期、传记等)以及与词典定义相关的问题等。该系统采用基于知识库和基于信息检索的混杂模式,系统还保留着原来的两个知识库,START KB”和“Internet Public Library。如果用户提出的问题属于这两个知识库的范畴,START就直接利用知识库中的知识返回比较准确的回答。反之,START系统将问题解析得到查询的关键词,通过搜索引擎得到相关信息,通过后续处理得到准确而简洁的回答返回给用户。比如提出一个问题“W

文档评论(0)

yiyezhiqiu88 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档