计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

基于组合分类器的信用卡欺诈识别研究(1)

2015-02-06 01:26
导读:计算机应用论文论文,基于组合分类器的信用卡欺诈识别研究(1)论文样本,在线游览或下载,科教论文网海量论文供你参考: 摘要随着我国信用卡发卡量和交易量的不断增长,信用卡交易中
摘要随着我国信用卡发卡量和交易量的不断增长,信用卡交易中的欺诈交易也呈现出上升趋势。如何较早的识别欺诈交易,将成为金融业普遍关注的一个重要问题。本文提出了一种基于AdaBoost组合分类器的信用卡欺诈识别模型,并通过实证研究证明模型能较为准确的识别欺诈交易。
关键词欺诈识别;数据挖掘;机器学习;分类

1引言
随着世界经济的不断增长和信息技术的迅猛发展,全球的信用卡使用量持续上升,信用卡已成为支付领域的主要媒介。截至2004年底,美国的信用卡发行规模达到6.57亿张,平均每个家庭拥有6.3张信用卡。在零售业的所有客户支付工具中,借记卡和贷记卡的交易额已经超过了总交易额的50%,大有取代现金和个人支票交易的趋势。而我国从2003年开始,各大银行都把信用卡的发行作为业务重点,宣传战、产品战、地域战随处可见,信用卡规模急速扩大。发达国家的经验显示,随着发卡量的增大,信用卡的欺诈风险将直线上升,由于信用卡欺诈而给银行造成的损失也将居高不下。据Visa和MasterCard两大信用卡联盟的统计,全球信用卡欺诈涉及金额已超过100亿美元[1]。如何加强对信用卡欺诈的识别和防范,将成为银行风险控制的一个焦点。
对于处于“跑马圈地”阶段的我国银行业,能否未雨绸缪,及时的建立一套信用卡欺诈识别和防范体系,既是我国信用卡业务健康发展的重要保障,又是一项兼有前瞻性和现实性的有益探索。

2信用卡欺诈风险与欺诈识别模型研究
信用卡的欺诈风险是指持卡人由于遭人冒申请、盗领、伪造、失窃等原因而发生损失的风险。由于欺诈风险所造成的损失绝大部分都由发卡行承担,因此对信用卡欺诈的识别和防范是银行风险控制的一项重要内容。
(科教作文网http://zw.ΝsΕac.cOM编辑)

从欺诈者在信用卡交易中的不同角色进行分类,信用卡欺诈可以分为商家欺诈、持卡人欺诈和第三方欺诈[2]。商家欺诈来源于合法商家的不法雇员或者与欺诈者勾结的不法商家。在现实中,商家雇员有条件接触到顾客的卡信息,甚至持卡离开顾客的视线,这都给不法雇员带来了复制或保留卡信息的机会。持卡人欺诈是由不道德的真实持卡人进行的,通常是持卡人充分利用信用卡的责任条款,在收到货物后称没有进行交易或者没有收到货物。第三方欺诈是目前信用卡欺诈的主要形式,是指不法分子非法获取他人信息,并利用这些信息伪造或骗领信用卡进行交易。由于非法获取信息的渠道较多,欺诈方式也不尽相同。
按照不同的欺诈手段,信用卡欺诈又可以分为身份盗窃欺诈、未达卡风险、遗失被窃风险、道德风险、欺诈犯罪风险五种[3]。
由于信用卡欺诈带来了巨大的风险和损失,因此银行一直在寻求一个行之有效的欺诈识别模型。最初是利用业务人员的经验知识对欺诈交易进行手动识别,但是随着信用卡发卡量的大幅增长和交易量的不断提高,信用卡欺诈愈演愈烈,且由于欺诈手法的不断翻新,业务人员很难迅速有效的从海量交易记录中觉察出欺诈交易。这时,需要有一个能对持卡者和信用卡交易进行快速判断的模型或系统来辅助业务人员的工作,而基于判别分析和回归分析的统计方法能通过给持卡者或信用卡交易进行信用评分的方式来识别欺诈交易,得到了广泛的应用。近年来,数据挖掘技术的兴起使人们开始关注基于数据挖掘技术的信用卡欺诈识别模型。利用数据挖掘中的分类方法,可以通过建立一个分类模型来准确的将欺诈交易和非欺诈交易区分开来,从而为欺诈防范和风险控制提供决策支持。人工神经网络[4][5][6]、决策树[7]等分类算法在欺诈识别上都进行了有益的尝试,取得了较好的预测效果。但是单一分类器的分类效能相对有限,不能得到一个很高的分类准确率,本文试图利用组合分类器来建立一个更为准确的信用卡欺诈识别模型。

(科教范文网http://fw.nseac.com)


3组合分类器与AdaBoost算法
实践中人们发现,分类算法实际上对样本集是敏感的,也就是说,在不同的训练样本和测试样本上,或者是在相同样本的不同特征空间上,同一分类器会有不同的表现。没有哪种分类算法是最优的,但是将多个分类器组合起来却能有效的提高分类的精度[8]。
上一篇:我国电子商务立法的几点问题浅析(1) 下一篇:没有了