医保欺诈行为的主动发现论文.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

医保欺诈行为的主动发现

摘要

本文主要讨论了主流的异常检测方法,着重研究并分析了基于统计分布的异

常检测在医疗保险数据挖掘中的应用。通过数据挖掘技术模型和聚类分析模型对

医疗保险数据特点进展研究分析,找出了医保欺诈行为的可能记录,同时给出了医

疗保险数据的预处理方法。

针对每类医疗保险报销行为,应用基于统计学的离群点检测,为其假设一个

分布,然后利用统计学的相关方法确定其参数,得到其准确的分布频数。以得到

的每类医疗保险行为分布频数为根底,利用区间选取算法进一步得到其正常阈值

区间。利用统计学和MATLAB软件针对医疗保险欺诈行为构建了数据挖掘模型和

聚类分析模型,模型考虑了数据间存在的相互联系,对医疗保险行为的欺诈做出

了统计和分析。通过对附表中的数据按照核算进展分类,对所得的三类核算结果

进展筛选,通过聚类分析的标准化进展处理,得到聚类分析模型的谱系图,再按

照标准化处理的结果进展排序,得到欺诈记录对应的病人ID号的顺序。

对用药事件,由于其成效并非药物成效的简单叠加,而是成效和成效、药物

和药物之间相互形成的复杂结果的特点,给出了效-效相似关系挖掘,以得到用药

事件的更准确的检验模型。本文最后通过对可能的欺诈记录随机选取进展检验,

结果得出:通过数据挖掘所得的可能医保欺诈记录,均可用单处方药费高、一次

性拿药数量过多、一样药物数量大和单价过高来解释。

关键词:异常检验;统计学;概率分布;聚类分析;数据挖掘技术

一问题重述

随着我国医疗卫生体制改革的深入,医疗保险参保人数正在迅速增加,同时

欺诈违规行为也在日益增多,形式和手段也不断的在翻新,对医疗保险基金的平

安造成极大的影响,社会危害极大。

医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保

险费、享受医疗保险待遇过程中,成心捏造事实、弄虚作假、隐瞒真实情况等造

成医疗保险基金损失的行为。骗参保人进展医保欺诈时通常使用的手段有:1、拿

着别人的医保卡配药;2、在不同的医院和医生处重复配药。下面这些都可能是医

保欺诈行为:单处方药费特别高、一卡在一定时间反复屡次拿药、过度医疗〔检

查、用药〕、分解住院、降低入院标准、分解收费、串换药品名和诊疗工程、冒

用与出借医保卡等。

二问题分析

本文的工作是将数据挖掘的相关技术应用到临床行为管理中,设计一个构建

正常临床行为进展异常检测的模型,这不仅能对合理的临床路径的制定提供决策

依据,并且对发现违规行为以及医疗欺诈有着非凡的意义。

数据挖掘,是从存放在数据库、数据仓库或者其他信息库中的大量数据中获

取有效、新颖、潜在有用、最终可理解的非平凡过程。所存在的大量数据中有许

多可以广泛应用,并且迫切需要将这些数据转化成有用的信息和知识。而数据挖

掘技术善于从缺乏先验信息的海量数据中发现隐含的、有意义的知识,预测未来

趋势和行为,及甄别不符合隐含规则的异常行为。正是这种优势使得数据挖掘技

术在医学数据的异常检验研究中被广泛地采用并取得了许多有价值的成果:

对于可能存在医疗欺诈行为控制方面,应用主要包括:决策树算法、回归模

型、神经网络模型等。对可能存在医疗欺诈行为的因素进展挖掘,根据就诊情况

可能存在反映欺诈行为,预防欺诈,促进医疗保险制度的标准化和规化。

本文主要讨论了异常检验方法,着重研究并分析了基于统计分布的异常检验

在医学临床数据挖掘中的应用。分析了医疗领域临床数据的特点以及适用于基于

统计分布的异常数据特点,以此为根底,本文对临床数据进展相应的预处理,由

于适用于统计分布处理的数据主要针对单个属性,也就是适用于低维数据,所以

本文对数据的预处理除了常用的数据集成、数据清理和数据规约等以外,还对其

尽心分类,并统计频率。建立了模型构架,实现了相关算法,并对模型的效果进

展了检验,验证了模型的正确性和可靠性。

三模型假设

(1)假设中的相关数据是在没有任何大型灾难或疾病时期收集的;

(2)假设其他未考虑的次要影响因素对模型建立不产生重要影响;

(3)假设各个中的相关数据都真实可靠〔除题中注明之外〕;

文档评论(0)

187****8586 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档