搜索
您的当前位置:首页大数据审计下统计分析方法探索

大数据审计下统计分析方法探索

来源:飒榕旅游知识分享网
龙源期刊网 http://www.qikan.com.cn

大数据审计下统计分析方法探索

作者:闵成志

来源:《全国流通经济》2018年第27期

摘要:大数据狂潮早在几年前就已经提出,大数据下审计工作应随着数据时代的变革而创新,完全脱离原有的审计方法是不现实的,但是创新和发展原先的传统审计作业流程在为响应国家“十三五”规划的大数据战略影响下势在必行。本文就相关数据处理、操作规范进行了深入探讨,找出其中存在的问题,为数据的发展贡献一份力量。 关键词:大数据审计;统计方法;第二经济

中图分类号:F239文献识别码:A文章编号:2096-3157(2018)27 -0117-02 2011年,美国经济学家Auther提出第二经济这一概念,而大数据是第二经济(second economy)的核心内涵和关键支撑,第二经济能够通过一定的形式将国民经济活动能够变得智能化,是由处理器、链接器、传感器、执行器以及运行上的经济活动形成了人们熟知的物理经济之外的非虚拟经济。他认为,因为大数据作为第二经济的主要支撑与内涵所在,而大数据以其愈演愈烈的趋势显得永远不会枯竭,预计约二十年以后,得利于大数据的膨胀壮大,第二经济的规模将逼近物理经济,用通俗的话来说就是大数据的价值会越来越高。那么一个人拥有足够的知识储备和大数据处理能力,在未来的第二经济的竞争下比起其他将大占优势。 一、什么是大数据 1.官方解释

大数据在水利大辞典上是这样解释的:因为大数据在水利行业上,该项技术主要用于对大空间、长序列的实时观测数据进行处理,以获取其中蕴含的信息。所以它是一个需要采用新处理模式才能使其具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在十余年潜心研究数据科学的技术权威维克托·迈尔-舍恩伯格教授认为一切皆可以量化,他在与数据编辑肯尼斯.尼尔-库克耶一起编写的《大数据时代》中提到:大数据时代最大的转变有不是随机样本,而是所有数据、不是精确性,而是混杂性、不是因果关系,而是相关关系,即我们不需要知道“为什么”,只需要了解“是什么”。IBM这样提出,大数据具有5个V的特点:大量(Volume)、高速(Velocity)、真实性(Veracity)、多样(Variety)、低价值密度(Value)。 2.非官方解释

龙源期刊网 http://www.qikan.com.cn

笔者无意间看到的一个有趣而生动的比喻,他将大数据比作水,个人数据也就是每个人使用自己的电脑、移动手机等电子联网设备所产生的一系列数据,就好比一颗一颗的小水珠,人们最多可以利用其解渴;而对于企业,因为其规模有一定的大小,于是他们的数据可以看做是水坑甚至池塘,可以养些小鱼小虾;那么对于另外一些大企业,他们的数据比如淘宝、脸书等日数据处理量十分庞大,可以将其数据量比作湖泊,于是他们可以在里面进行大规模养殖、捕捞水产,只是是否以养殖作为自己的盈利方式取决于他们自己。愈来愈多的江河湖泊汇聚,最终定会成为海洋。 3.大数据存在的问题

首先大数据有着如上文所述的像数据类型多样、及时响应和数据的真实性等特点,因为数据类型多样使得一个应用往往要同时处理多个非结构化数据和结构化数据,现有的数据库系统还没有具备这种应对能力;其次,我们对于数据真伪和不可预测性应持保留态度,而往往需要高质量的数据来保障分析结果的可靠性;最后是时间问题,“时间就是金钱”,这句话如果出现在不能快速响应这一情况下,就显得尤为突出。 二、统计分析方法在大数据审计中的核心作用

数据处理基本步骤:第一,数据采集;第二,导入及预处理数据;第三,统计及分析数据;第四,挖掘数据疑点。随着数据量的疯涨,在一个分析过程需要各方面的数据,导致数据类型变换多样,要求审计人员将其进一步结构化、可视化,这就属于统计分析范畴,而作为审计作业核心部分,审计内容、技术、方法与审计质量有密不可分的关系。如何利用好统计分析方法分析数据、找出突破点显得格外重要。 1.导入及预处理数据

普遍意义上的数据预处理是数据挖掘最关键的部分之一,需要将无关数据、无意义数据以及错误数据进行剔除和整理,使其直观整洁,即专业术语称作将数据根据具体需求进行结构化处理。通常开展审计工作是选定了特定的过去时间段的,随着审计过程的进行,实时数据同样在不断更新和增加,于是聪明的审计工作者就以备份并还原数据的方式弥补这个缺陷,能够及时处理更新增加的数据,丝毫没有遗漏。传统审计过程使用的数据库软件有SQL及Oracle等,创新审计对数据进行预处理应该尽量遵从使用完备功能的统计通能专业软件。 2.统计分析方法分析数据、挖掘数据疑点

统计分析方法以统计学观念作为核心思想运用数理统计思想以及统计学基本知识,快速呈现海量数据中存在的离散点,进而找出数据中不符合客观事实或者逻辑的地方,然后精准定位可疑数据,进行相关操作,比如删除、修正或者替换。统计分析主要分为以下5个步骤:步骤一,在数据已经结构化的前提下,根据研究目的通过回归分析、参数检验等分析方法描述要分

龙源期刊网 http://www.qikan.com.cn

析的数据的性质;步骤二,研究基础群体的数据关系,确定审计疑点;步骤三,创建一个模型,总结数据与基础群体的联系;步骤四,证明(或否定)该模型的有效性;步驟五,采用预测分析来预测将来的趋势。

三、统计分析方法在大数据审计中的操作规范 1.描述性统计在大数据审计中的操作规范

什么是描述性统计?是指运用制表、分类、图形以及计算概括性数据区间推导来明确描述数据的特征的各项活动,描述项目特征时,需要进行数据的频数分析、集中趋势分析、离散程度分析、分布以及对一些基本的统计图形进行简单的合理的描述。

频数分析最主要的功能是其与交叉频数分析结合以检测数据的异常值,有一定的可靠性;集中趋势分析则更显得较为直观,他的表现形式就是常用指标的均值、众数、合计值以及分位数等;离散程度分析可以表现差异程度,即方差、标准差、t分布以及f分布等;分布中运用偏度和峰度来检测其是否符合正态分布;统计图就是一系列检验与分析创造出来的成果图形,比起文字更贱直观明了,常用SPSS、Matlab以及Mathmatics等数学软件,Excel也是常用的绘图办公软件,很方便的绘制出条形图、饼图、折线图以及散点图等。

优秀的审计工作不仅要求审计人员对数据的整体把握,还需要通过图表与结构化数据分析能够将结果很好的证明出来,完整的将数据属性、数据分布及离散程度解释有理有据。将审计结果中的大量的细节数据与审计目的相结合,得出令人信服的结论,快速、有效地让数据真正服务于审计工作。

2.关联分析在大数据审计中的操作规范

什么是关联分析?关联分析又称关联挖掘,是一种普遍、简单而又实用的分析技术,在数据信息的载体中,找出集合之间的频繁模式、相关性或者因果关系,简而言之就是找出其中的关联。最著名的关联规则挖掘算法之一Apriori算法是挖掘产生布尔关联规则所需频繁项集的基本算法,通过迭代,前一项集用于探索后一项集,直到不能找到为止,探索多少次就需要扫描多少次数据库,算法中的缺陷显而易见,但是科学家们的思维是令人敬佩的,后来也出现了越来越多的优化算法,给大数据的统计分析带来一定的方便。

如今多数购物平台将顾客的浏览记录利用关联分析方法得出顾客的购物习性,从而推送相关产品和广告,借此提高销量,不得不说此方法科学合理,可以算作是一个贴心的服务手段。审计者通过关键字制表,表与表之间的关联关系得出不同交易情况和隐藏作用关系,同时挖掘异常数据,找出其中的因果,从而还原事实。 四、结论

龙源期刊网 http://www.qikan.com.cn

综上所述,基于大数据的统计分析还存在诸多的问题,需要科学工作者前仆后继的完善与优化。大数据的处理和统计分析的的最大优点或者说是他的功能在于海量的数据的揭示人们在各种应用中作出决策习惯,以便人们在失去自我时更好作出理性的判断。在此过程中,需要大家深度学习、知识计算。 参考文献:

[1]田程涛.大数据审计下统计分析方法研究[J].会计之友,2018,(01):140~145. [2]陈伟,Smieliauskas Wally.大数据环境下基于数据可视化技术的电子数据审计方法[J].中国注册会计师,2017,(01):85-89+4.

[3]陽杰,应里孟.大数据时代的审计证据与审计取证研究[J].财会月刊,2017,(01):115~124.

[4]秦荣生.大数据、云计算技术对审计的影响研究[J].审计研究,2014,(06):23~28. 作者简介:

闵成志,供职于安徽省马鞍山采石风景区管委会。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top