7 SILICON VALLEY 鬟 j【高新技术产业发展】 云存储应用的前提和云存储的隐患 杜宏文 (国家广播电影电视总局二O二二台新疆喀什844000) 摘要:主要介绍什么是云存储,云存储应用的前提条件,和云存储的隐患。 关键词:云存储;前提;隐患 中图分类号:TP3文献标识码:A文章编号:1671—7597(201 3)0110020—02 1什么是云存储 在认识云存储前我们必须先简单了解一下云计算。云计算 是分布式处理(Di stributed Computing)、并行处理 (Parallel Computing)和网格计算(Grid Computing)的发 展,是透过网络将庞大的计算处理程序自动分拆成无数个较小 的子程序,再交由多部服务器所组成的庞大系统经计算分析之 后将处理结果回传给用户。通过云计算技术,网络服务提供者 可以在数秒之内,处理数以千万计的信息,达到和“超级计算 机”同样强大的网络服务。 云存储就是在云计算(Cloud computing)概念上延伸和 发展出来的一个新的概念。云存储,它是指通过集群应用、网 格技术或分布式文件系统等功能,将网络中大量各种不同类型 的存储设备通过应用软件集合起来协同工作,共同对外提供数 据存储和业务访问功能的一个系统。 2云存储应用的前提 2.1带宽的保证 标准的云存储系统是一个在地理位置上跨越全球的公用系 统,使用者需要通过各种网络接入手段接入互联网从而连接使 用云存储。而不是在通过企业内部万兆、千兆,百兆局域网接 入私有的存储设备上。在目前中国普遍宽带速度在2M情况下, 使用云存储基本是不靠谱的事,试想白天我把单位晚会视频 1G大小放在百度网盘上,晚上需要回家写观后感,以每秒 512KB的速度下载,需要34分钟才能下载完成,而我通过高速 u盘,只需要不足3分钟即可在家的电脑上观看,所以只有宽带 网络得到充足的发展,使用者才有可能获得足够大的数据传输 带宽,实现大量容量数据的传输,真正享受到云存储服务,否 则只能是空谈。 2.2终端业务的分享 我们已经从互联网上获取信息变成了互联网信息的制造者 和参与者。在微博时代,云存储的使用者才有可能通过Pc、手 机、移动多媒体等多种设备,实现数据、文档、图片和视音频 等内容的集中存储和资料共享。 2.3应用存储的发展 云存储不仅仅是存储,更多的是应用。应用存储是一种在 存储设备中集成了应用软件功能的存储设备,它不仅具有数据 存储功能,还具有应用软件功能,可以看作是服务器和存储设 备的集合体。应用存储技术的发展可以大量减少云存储中服务 器的数量,从而降低系统建设成本,减少系统中由服务器造成 单点故障和性能瓶颈,减少数据传输环节,提供系统性能和效 率,保证整个系统的高效稳定运行。 2.4多种新技术确保云存储应用 内容分发网络CDN、对等网络P2P技术、数据压缩技术、重 复数据删除技术、数据加密技术。这些新技术的使用在确保网 络传输速度的同时通过各种数据备份和容灾技术保证云存储中 的数据不会丢失,保证云存储自身的安全和稳定。如果云存储 中的数据安全得不到保证,那么是没有人敢于使用云储存的, 存储的原则还是安全第一,便捷第二。 2.5存储网络化、虚拟化管理技术 云存储中的存储设备数量庞大、分布地域广造成的另外一 个问题就是存储设备运营管理问题。虽然这些问题对云存储的使 用者来讲根本不需要关心,但对于云存储的运营商来讲,却必须 要通过切实可行和有效的手段来解决集中管理难、状态监控难、 故障维护难、人力成本高等问题。因此,云存储必须要具有一个 高效的类似与网络管理软件一样的集中管理平台,可实现云存储 系统中设有存储设备、服务器和网络设备的集中管理和状态监 控。云存储中的存储设备数量庞大且分布多在不同地域,如何实 现不同厂商、不同型号甚至于不同类型(如Fc存储+lIP存储)的 多台设备之间的逻辑卷管理、存储虚拟化管理和多链路冗余管理 将会是一个巨大的难题,这个问题得不到解决,存储设备就会是 整个云存储系统的性能瓶颈,结构上也无法形成一个整体,而且 还会带来后期容量和性能扩展难等问题。 2.6集群技术、网格技术和分布式文件系统 云存储系统是一个多存储设备、多应用、多服务协同工作 的集合体,任何一个单点的存储系统都不是云存储。既然是由 多个存储设备构成的,不同存储设备之间就需要通过集群技 术、分布式文件系统和网格计算等技术,实现多个存储设备之 间的协同工作,使多个的存储设备可以对外提供同一种服务, 并提供更大更强更好的数据访问性能。如果没有这些技术的存 在,云存储就不可能真正实现,所谓的云存储只能是一个一个 的独立系统,不能形成云状结构。 2.7云存储完整性监测方法和标准 完整性监测在云存储服务中是必不可少的,同样,数据完 整性也是所有数据中心最核心的任务。任何级别的存储和任何 类型的媒质都有可能发生数据损坏。位衰减(存储介质上的数 据减弱或丢失)、控制器故障、重复数据删除元数据损坏、磁 带故障是导致不同类型媒质数据损坏的主要因素 元数据损坏 是上述故障导致的直接结果,比如位衰减,并且也极其容易受 到除硬件错误率以外的软件故障的影响。不幸的是,重复数据 删除的一个副作用是,损坏的文件、块(block)或字节将影 响到每一块与之相关联的元数据。事实上,存储坏境内的任何 一个环节都有可能发生数据损坏。将数据迁移到不同的平台过 程中很容易就被损坏,即将数据迁移到云端。云存储系统也是 由硬件和软件组成的数据中心,其也容易受到攻击而导致数据 损坏。比如最近广为人知的亚马逊云宕机事件。许多企业不仅 受到长时间的宕机影响,实际上,他们O.07%的客户数据已经 丢失。据报道,引发数据丢失的原因是“亚马逊ESB卷不一致 的数据快照恢复。”这就意味着亚马逊系统中的数据已经损 坏,因此,客户数据已经丢失。每当数据丢失,尤其是重要数 据丢失,人们倾向于相互指责以推脱责任。在IT行业,这通常 会导致工作人员被解雇、公司承受巨大经济损失,甚至最严重 的情况是企业破产。因此,关键是要了解云服务提供商要承担 的法律责任,以及每个服务水平协议(SLA)已采取一切可能 【高新技术产业发展】 囊 的措施以确保数据的安全,防止数据丢失。就很多法律文件来 说,SLA大多偏向于提供商的利益,而不是客户的利益。许多 云服务提供商都提供了不同层次的数据保护,但是,所有的存 储供应商都不对数据完整性承担责任。 云SLA协议,包括云提供商的保护都明确表明,数据丢失 或损坏是最常见的情况。比如亚马逊的客户web服务协议,其 中规定, “我们不提供任何形式的声明或保证,所提供的服务 的通过WEB或Pc客户端在异地甚至即时取回照片,但是大家可能 不太相信的是你上传的每一张照片或其他文件都有可能是云存 或第三方内容是不间断的、无差错的、无故障部件的,或任何 内容将是安全的、不丢失的或无损坏的。”这个协议甚至据以 建议客户“频繁归档”他们的数据。如前所述,数据的完整性 管理,无论其是在数据中心、私有云、混合云或公共云,其责 储的服务端是明文保存的,据参与过某云存储项目开发的人员 介绍从目前运维成本上考虑实现私钥加密不太现实,管理员可 以服务端的平台中直接查看和删除用户上传的文件,这些文件 中不泛用户的机密文件或用户私隐,现阶段大型服务端都是通 过建立严格的制度体系来约束管理人员的职业操守,但是人都 是弱点的,一旦人的操守被弃的时候在其权力范围内可视的内 容是否还是只属你是自己呢? 3.3数据安全 从数据安全上分两个方面分析,1)用户的操作安全。目 任总是要该数据的实际拥有人来承担。 前大多数的云存储都设计了多客户端数据同步机制,一般以最 3云存储的隐患 后一次更新为标准,其他客户端开启时自动同步,这点与 从功能实现上来讲,异地文件存取与文件分享共步技术早 SVN的设计有很大的差别,当一个用户在公司编辑某个文件 上互联网形成之初就已经得到应用,上个世纪初互联网刚刚进入 后,回到家中再次编辑,那么当他再次回到公司时文件已是昨 国内时就有厂商提供过网盘服务,当时所谓的网盘并不是现在大 晚在家更新过的,这是理想状态下的,在很多时候用户编辑一 家所熟知的网络虚拟磁盘,当时的网盘更像是一个SVN或FTP的客 个文件后,会发现编辑有误,想取回存在公司的文件版本时, 户端,而今十多年的发展以后,融入了移动互联网营销理念与新 可能在没有支持版本管理云存储中你的附本也已经被错误的更 技术的“网盘”被包装成了“云存储”高调的出现在大众面前, 新了,同样的道理你删除一个文件时候,如果没有额外的备 据相关统计数据显示国内一线的云存储服务商每天的用户数据新 份,也许你到网盘回收站中再找了,版本管理技术上并不存在 增量已经达PB为单位,可见每天都有数以亿计的用户正在向自己 问题,但是会加大用户的操作难度,目前的云存储服务商只有 云存储空间中上传下载着各种文件,在这种环境下排除网络带宽 少数的私有云提供商有限的支持,多数情况下这种覆盖是时常 消耗之外,我们是否应该反思一下云存储下的未来隐患。 发生的。2)服务端的安全操作:云存储服务器早已经成为了黑 3.1版权风险 客入侵的目标,因为服务器上不仅有无穷用户数据,对此类大 有关版权问题目前已经大范围的出现在了国内的网盘服务 用户群服务的劫持更加是黑色收入的重要来源,也就是说服务 中,一些个人或团体会将以影视音乐为主体的文件通过云存储 器的安全性直接影响着用户上传数据的安全,在服务器虚拟化 的客户端上传至网盘中,然后通过分享的方式对圈子内提供下 技术的支撑下V2V迁移的可靠性相当高,多数的云存储厂商都 载,大量的有版权的视频音乐被这种特殊盗版方式进行传播, 预备安全防护方案,但是不能忽视的永远人的操作。 而且这种传播方式暂时属于监管的空白,部分云存储提供商在 3.4运营停止 版权单位的压力下开始限制链接分享的范围,加强文件的过 在当下的互联网环境下,提供公众的云存储服务,每年的 滤。但是这些手段目前不能从根本上解决云存储中用户上传文 资金投入在5亿元以上,而且目前对私提供的云存储盈利模式还 件的盗版传播。而要建立起一整套影视文件数字指纹签名检验 并不清晰,究竟有多少服务商可以持续永久的提供这种服务, 系统除了庞大的研发的运维成本外,各个利益团体之间的技术 这种服务后期是否收费?是否会因为亏损问题、盈收问题而被 标准统一也是短期内难以统一的,但是在问题得到解决之前, 迫停止运营,在这种情况已有用户的数据向何处迁移?数据安 此刻这种分享还在进行中,面临侵权问题不仅是用户还是云存 全由谁负责,即时通讯和邮箱的盈利模式已经成熟所以相关厂 储的提供商。 商可以持续免费到现在,而云存储的投入至入是前两者之和的 3.2个人隐私 十倍,厂商之间的服务整合和公约形成,首要解决并不是技术 有很多移动平台用户喜欢随时将自己用手机或平板拍摄的 问题,而是利益分配问题,服务商在一定时间会关停服务才是 照片与视频通过云存储快速上传到网盘中,这样可以非常快捷 用户数据留存问题最大的隐患。 (上接第33页) Str.Format(本文建立的模型有效地模拟了储油量与油位高度和变位参 T( x=%f,y=%f,min=%f ),m,in_,min): MessageBox(str): 数之间的关系,适用于一般角度倾斜变位情况,并且计算结果精 fun(double h,doub1e x,double y)//函数 确度高,具有很强的现实意义,可以在实际中广泛的推广应用。 { return0://输入油量函数v(h,X,y),其中X=C,y=d 参考文献: ) 【I】陈佰军、左振滨,编制卧式储油罐容量表的计算机模型[N].黑龙 4模型的评价与推广 江八一农垦大学学报,1993年3月,第七卷,第二期:第55-60页. 利用微积分求得油量值与油位高的关系,利用软件进行符 【2】李继成,数学实验[M】.北京:高等教育出版社,2011#-5. ̄:第 号积分计算,函数本身无误差,只有电脑计算的系统误差,计 44-50页. 算结果精准,准确度高,并与实际值做了比较,吻合性相当 【3】陈杰,MATLAB ̄典(第三版)【M].北京:电子工业出版社, 2011年1月:第296—310页. 好,可行性高。 f4]Mark M.Meerschaert著,刘来福、杨淳、黄海洋译,数学建模方 利用搜索算法求得最优解,从而充分通过油量、油位关系 法与分析【M】.北京:机械工业出版社,2010年4B:第43-70页. 得知储油罐的倾斜状态,模型可以根据不同的测试数据进行计 算。 作者简介: 每一个公式中的参量都为变化量,随时可进行调节,这样 朱夺宝(1981一),男,硕士,讲师,新疆阿拉尔市塔里木大学信 使得模型使用范围得到进一步推广,适用于更多情况。 息工程学院,研究方向:应用数学、传染病动力学。 巨=-l圈