如何利用公共云存储构建中小企业存储
中小型企业(SME)的技术需求虽然比大企业的少,但仍然很重要。其中的关键是中小企业的存储。
在过去,这通常意味着是企业使用存储的缩小版本,但人们现在生活在云存储越来越重要的时代,这对于缺乏大型组织拥有的IT部门资源的中小企业尤其重要。
那么,中小企业可以采用什么方式转向云存储?使用云计算将预算用于运营支出,可以显著降低购买和维护存储硬件的成本。中小企业的问题是最好地应用这些有好处的地方。
公共云可以很好地处理辅助数据,例如备份。此外,主目录和共享数据的文件存储可以是一个很好的云存储用例,尽管其安全问题需要一些思考和规划。
传统的核心应用程序(如数据库、ERP)可能是最难适应云存储的。
内部部署的超融合基础设施对于中小企业来说非常适合,这消除了对SAN存储及其相关技能的需求,但是,对于希望实现存储基础设施现代化的中小企业,有许多方法可以从云存储产品中受益,同时结合使用具有内部容量的这些。在本文中将介绍其中的一些内容。
主存储和辅助存储:结构化和非结构化
通常,存储需求分为两个主要区域。主存储定义了运行业务的生产工作负载的要求。
二级存储是非生产数据的任何东西,因此可以是当前使用的任何东西。下一个关键区别在于结构化和非结构化数据。
结构化数据是数据模型中保存的数据,例如驱动企业资源计划(ERP)、事务处理或网站的数据库。由于数据的延迟敏感性,交易系统通常部署在基于块的存储解决方案(如SAN)上。
非结构化数据是指在数据库类型模型之外的任何数据,因此几乎可以包括从办公室文档到图像和流式视频的任何内容,尽管这些类型的数据通常包含可以被查询的元数据头,因此可以使其有效地将数据实现半结构化。
非结构化数据(无论是主要数据还是辅助数据)通常保存在网络附属存储(NAS)/文件访问或对象存储中。
因此,在中小企业中,人们将看到块、文件和对象协议的要求。毫不奇怪,公共云供应商已经与这些供应商保持一致,以便在其存储产品组合中提供每种协议,这并不奇怪。
块存储和云计算
在公共云中,块存储通常只能由本地虚拟计算实例访问。这有两个主要原因:
首先,虚拟实例需要块存储以用于引导和本地数据驱动器。这些通常在运行虚拟实例的管理程序内的虚拟环境中实现。
第二个问题是性能问题。基于块的存储和应用程序对延迟敏感,特别是对单个输入/输出的响应时间。
同时,内部共享存储(例如在SAN中)可以从混合阵列提供低于10毫秒的响应时间,对于全闪存系统而言通常为亚毫秒级。
那么,如果中小企业想要使用块存储和公共云,那么如何实现呢?一种解决方案是使用存储网关。这些是位于内部部署数据中心的硬件和软件设备,通过iSCSI等协议在本地提供块存储。
数据定期存档到公共云,以提供一种数据保护形式,或突破或扩展云计算内部容量的能力,或者来自Microsoft(StorSimple)和Amazon(存储网关)的解决方案。
另一种方法是将应用程序迁移到公共云中,并在那里使用基于块的云存储。这可能需要成为更广泛地利用公共云策略的一部分。
非结构化数据
存在两种管理非结构化数据的选项。第一种是在公共云中使用基于文件的存储,第二种是使用对象存储。
在这两种情况下,所涉及的协议(文件的NFS/SMB,对象的HTTP)将在广域网上工作,尽管文件性能可能对延迟敏感。
文件存储提供与内部部署网络附属存储(NAS)设备类似的功能。使用基于云计算的解决方案可消除在数据中心部署硬件时常见的所有基础设施管理问题。可以根据云计算提供商提供的限制动态创建和扩展新文件系统。
随着NetApp等厂商开始提供现有的和成熟的存储产品(如ONTAP环境)作为本地云服务,过去一年中基于云计算的文件服务的成熟度有所提高。基于云计算的文件存储解决方案可以节省成本,并提供运营优势。
像Nasuni Primary这样的平台可以在客户所在的任何地方提供全局文件访问。这样可以更轻松地实施灾难恢复,而无需进行昂贵的基于阵列的复制或备份。
全局访问还可以减少数据重复,其中出于性能或操作原因将数据复制到多个位置。使用单实例数据,意外使用过期内容的风险也低得多。
文件存储安全性和数据保护
使用基于云计算的文件存储也带来了新的挑战。最明显的是安全性。
虽然数据可以通过公共互联网传输并加密,但这不是一个理想的解决方案。中小企业可能希望投资与云计算提供商的本地点对点VPN连接,但这会增加成本和复杂性。
为了额外的安全,数据还应该在公共云内使用客户生成的密钥进行加密。
内部部署文件服务仍然需要与内部部署系统相同级别的操作管理。安全性是一个显而易见的领域,正如人们所讨论的那样,它包括传输数据和静止数据进行加密。
凭据管理是另一个关注领域,一些供应商提供与Active Directory和LDAP的集成。
最后请记住,默认情况下不会备份公共云中的数据。公共云服务提供商将承诺服务水平协议的正常运行时间,但任何备份将只是为了使服务重新联机。
云计算提供商不会意外或恶意删除数据,因此还应该查看云平台之间的备份。
对象存储
作为一种非结构化存储协议,对象存储是以经济实惠的价格存储大量数据的好方法。
对象只是文件的大小,从几千字节到几千兆字节,通常存储在大型逻辑容器(如存储桶)中(在AWS中)。
对象存储使用HTTP作为其底层协议,通过基于REST的API发出请求。因此,每个对象存储请求实际上都是一个独立的事件,因此不提供文件锁定等功能。
对象存储适用于流式访问或大规模处理大量文件(例如分析)。
中小企业可以将对象存储用于很少更改的内容(文档存储库、视频和音频媒体库),或者每次刷新或更改整个对象时替换整个对象的位置。
成本效益
云计算服务提供商提供基于预定义策略优化数据放置的特性。例如,客户可以实施一个流程,将不常访问的内容移动到像AWS Glacier这样的冷存储。
尽管在访问冷数据方面存在限制,但可能节约很多成本。备份和归档非常适合放置在具有基于策略的分层的对象存储上。
在查看对象存储时,有一个警告:由于两个主要原因,数据量可能会显著增加。
首先,如果需要保留以前版本的文件,则每个对象将以全价收费(尽管可以通过策略对它们进行分层以降低存储成本)。
其次,云计算提供商不会传递内部存储功能(如重复数据删除)的任何好处。在最坏的情况下,两个版本的10GB文件相差仅一个字节将会产生20GB的传输费用。
数据保护
公共云存储的一个很好用途是用于数据保护。
正如人们所讨论的问题,对象存储提供低成本的长期存储,其容量实际上是无限的。这可以很好地作为备份目标,对象协议也非常适合备份数据的数据流特性。
利用位于中心位置的数据,可以从多地办事处执行恢复,云计算提供商可以在数据中心和地理位置之间复制数据。
但是,使用对象存储进行备份不能利用本地重复数据删除。这需要包含在备份软件中以实现此特性,否则进行许多类似备份的成本可能会变得非常昂贵。
市场
最后,人们不应忘记许多现有存储供应商提供其现有硬件和软件解决方案的基于云计算的版本。
这不是更新到新硬件,而是提供了转向运营模型,并减少内部部署硬件占用空间的机会。