随着企业逐渐对数据中心技术和人力资源实行标准化,昂贵、复杂的Unix 系统越来越难以为继。能够提升x86 性能并降低复杂性的新技术的发展,可能会使专有Unix 遭受彻底的淘汰。能够看到,在基于英特尔® 的服务器上配备120 个核心后,就可以实现在x86 系统上应对几乎所有的工作负载。
如果您拥有深厚的计算机科学或电子工程背景,那么您可能会对这场持续已久的最快芯片争夺战感兴趣。每隔 12月至 24个月,IBM 或 Oracle(英特尔®和HP已退出这场比赛)就会推出一款新型芯片,让自己在这场竞争中暂时领先。暂时领先的一方将成为新的“山大王”,公司高管会走到幕前揭开新产品的神秘面纱,并慷慨激昂地宣称他们的新型芯片多么的具有革命性,必将终结这场竞争。如果您热爱行业基准,喜欢分析令人头疼的性能声明和反驳,您就会发现专有 Unix市场之争非常吸引人。
否则的话,当您看到专有 Unix系统的年度出货量(2013年为 12万)和 x86服务器的出货量(980万)时,就会纳闷到底是怎么了。IDC和 Gartner每年都会将这些数据汇总,结果显示专有 Unix系统的收入每年都会下降 10 %到 15%。在我们所处的行业里,技术被完全淘汰的情况鲜有发生。您仍然能从 IBM 买到大型机,也能从 Sperry买到超级计算机,但从很大程度上来说,现在已经是 x64的天下了。大多数行业观察人士都将 ARM – 最常用于智能手机的芯片,现在也用于服务器设计 – 视为比 IBM 的 Power7或 Oracle 的 T5/M5 芯片更大的潜在竞争对手。
如果您还在运行专有 Unix系统,您一定在考虑是否还要继续用下去。实际上,您可能已经决定不再使用了,现在正在决定要采用哪一种更换策略。无论您作何决定,更换这些昂贵设备的过程都不是一件小事。
专有 Unix 的优点
如果您拥有专有系统,继续使用专有 Unix也有一定的好处。毋庸置疑,这些系统高度可靠,供应商也致力于改进性能和开发能够处理大量计算任务的大型高端系统 – 毕竟,这能带来最丰厚的利润。
如果您一直都在运行这些系统,继续使用无疑是一种安全的选择。虽然这些系统的整体收入在持续下降,但出货数量下跌的速度并没那么快。这意味着,软件供应商看到了一个相当稳定且利润丰厚的市场,因此会继续为这些系统提供支持。但还是要提醒您 :供应商无疑不会再首先针对 Unix系统进行研发,然后再将研发成果移植到其他系统。实际上,Unix可能成为最后获得移植的系统,具体取决于所涉及的软件和供应商。在经历过不太体面的官司之后,Oracle 肯定已不再急于向 Itanium移植软件。如果您还在运行专有Unix 系统,您一定在考虑是否还要继续用下去。
专有 Unix 的缺点
从不利的一面来说,专有 Unix系统会造成大量的资本支出和运营支出。虽然基于RISC 的服务器价格已然有所回落,但相对于功能相当的 x86系统仍然普遍较高,而且产品越高端,价格会越高昂。更令人担忧的是服务器的支持系统 – 专有系统的存储和网络设备可能由相同的供应商提供,也可能由第三方提供。因此,支持系统的性能改进与服务器的性能改进可能无法同步。
但最大的问题应该在于人员配备。年轻的员工从未见过 AIX、Solaris 或HP-UX 系统。他们能够很好地处理 Linux系统(因此具备处理 Unix的基础),但贵公司将不得不花钱让他们了解专有 Unix操作系统的最新情况。而运行这些专有系统的现有员工通常薪水都很高,却可能并不精通 Linux、VMware或任何 Microsoft操作系统、虚拟机管理程序和管理系统。当数据中心标准化带来的良好效率和灵活性让 IT 团队能够更好地满足业务需求时,Unix系统及其运营团队就会在对兼容性和标准化的需求方面变得孤立无援。
专有 Unix系统是一项非常独特的资源,因此,考虑到需要避免风险,单单拥有这种系统都会是一件相当冒险或昂贵的事情 – 这意味着系统级别和操作级别的冗余。对于大多数组织而言,问题不在于是否要淘汰这些系统,而是何时淘汰。
基于 x86 的系统能否胜任工作?
本文不会详细讨论 CPU 和其他低级组件(它们可决定 x86系统能否拥有与现有系统一样甚至更好的性能)的具体特征。然而,从某种程度上来说,媒体和供应商把重点放在 CPU 性能上是受到了误导。这种认识的理论基础是 :只要有了更快 / 更好的 CPU,您就能处理更多事务或为更多客户提供服务。但事实是,虽然CPU 很重要,但其他组件却更可能导致应用程序瓶颈,因此最好把钱花在系统的其他地方以缓解这些瓶颈。
但是,在结束 CPU 的话题之前,值得指出的是,当前基于 Ivy Bridge体系结构的高端英特尔®服务器芯片将在每个芯片上配备多达 15个核心,每个系统配备多达 8 个插槽。虽然 IBM 和Oracle 都会声称自己的多路系统更快,但能够在基于英特尔®的单个服务器中配备120个核心意味着您能够在 x86系统上应对几乎所有的工作负载。与 Oracle 一样, 的I/O接口也采用了速度非常快的 PCIe 3.0,其内存体系结构最高可支持四通道 DDR3 内存,同样也很快。结果就是,内存和 I/O 性能至少能与 IBM 和Oracle 持平,而这就是通常会影响高端数据库和事务型应用程序的两大瓶颈。
固态至关重要
对于大多数数据库和在线事务处理 (OLTP) 应用程序而言,磁盘路径是最大的瓶颈。在经典关系数据库中,必须先将事务写入磁盘然后读回,才能完整提交。而分析应用程序需要处理大量的数据读取和处理操作,写入操作相对较少,对于这类应用程序,SAP 的 HANA 等 全 新内存数据库就是不错的选择。
处理时间可以缩短 100倍甚至更多,以往需要数小时的操作现在只需几秒钟即可完成。
但对于经典的 OLTP 应用程序而言,由于需要进行的写入操作通常要多得多,因此仍然需要将数据写出到磁盘或一些其他非易失性内存上。CPU 以微秒为单位时间运行,而硬盘以毫秒为单位时间运行,通常情况下,正是这种1000:1的速度差限制了数据库的性能。固态硬盘或其他形式的非易失性内存的引入,使得 OLTP 系统的性能能够提升高达 10倍或更多,具体取决于应用程序和系统体系结构。业内的争议并非是否要使用固态硬盘来提升 OLTP 性能,而是如何使用。虽然从某种程度上来说,固态硬盘的成本下降得比高性能硬盘更快,但配备全固态硬盘系统的成本仍然高得惊人,这种情况还将持续至少好几年。普遍接受的折中方案是使用固态硬盘作为非易失性高速缓存。
这样的系统只比不使用固态硬盘高速缓存的系统略贵,但性能却要好得多。由于固态硬盘的速度非常快,使用固态硬盘就意味着旧的 I/O 体系结构将立即变成影响性能的瓶颈。如果您只是几年前才开始使用专有 Unix系统,采用固态硬盘高速缓存将对性能有所帮助,但作用远不及对配备多个 PCIe 3.0 通道的现代系统那么大。
高速缓存流
高速缓存的流向也是争议的焦点。如果您是一个存储供应商,您会说高速缓存应流向存储阵列。如果您是一个服务器供应商,您会说高速缓存应驻留在服务器中 两种方法各有利弊。如果将高速缓存安置在服务器中,当将数据写回到存储阵列时(这个过程非常复杂),您一定会担心其他服务器高速缓存会失效。如果将高速缓存安置在阵列中,阵列控制器最好速度很快,同时与阵列的网络连接也必须非常快,而且资源充足。一个 PCIe 3.0 设备的传输速度最高为 8 Gbit/s,因此无法有效满足 10 Gbit/s 以太网连接的要求。如果您想找一个在数据中心内投资 40 Gbit/s 或100 Gbit/s 以太网的原因,阵列端固态硬盘就是答案所在。
虽然所有这些听起来可能会比较复杂(确实很复杂),但专有 Unix系统也能为您带来优势,其中之一就是供应商通常会负责完成存储与网络可能需要的任何内容之间的集成。在 x86环境下,通常需要您亲自或由第三方担任集成商来完成集成。
一种经过简化且基于行业标准的方法
还有一种更好的方法,就是依靠单个供应商提供 x86服务器、存储设备、以太网联网设备和管理系统,它们可以在降低复杂性的同时提供优于现有专有 Unix系统的性能,同时还能使用您试图借以实现标准化的操作系统和虚拟机管理程序。
Dell Fluid Cache for SAN 就是这种的一种方法。通过将戴尔一流的基于 的服务器与戴尔联网设备和 Compellent 存储阵列相结合,戴尔实现了一种全面集成的受管方法,来让您真正实现两全其美 :Fluid Cache for SAN对服务器端高速缓存进行池化,从而将最常用数据的访问时间缩到最短。Dell Fluid Cach forSAN 采用高度可用的回写高速缓存体系结构,以显著降低 SAN 环境中的延迟。
部署 Dell Fluid Cache for SAN 解决方案可以帮助 OLTP 和 VDI 用户实现显著的性能提升。这种解决方案可在 Linux和 VMware操作系统上运行,这两种操作系统都被广泛应用于数据中心环境。
性能说明一切
最根本的问题当然是,这样的系统性能如何。在去年年底举行的 Dell World 大会上,戴尔展示了一个使用 Fluid Cache for SAN 和 R720服务器群集的系统。这个戴尔系统实现了高达516万的 IOPS,令人印象深刻。
一项针对 OLTP Oracle ? 工作负载模拟的Dell Fluid Cache for SAN 实验室测试(该测试使用 8 个包含 PowerEdge PCie Express Flash固态硬盘、戴尔联网设备和 Dell Compellent
存储的 Dell Power-Edge 服务器)在同时支持14,000个用户的情况下,实现了 6 毫秒的平均响应时间和 12,609的每秒事务处理量。相对于在没有使用 Dell Fluid Cache for SAN 的相同戴尔硬件堆栈上进行的同一测试,此次测试得到的每秒事务处理量增加了3.9 倍,支持的并发用户数 为 6 倍,6 毫 秒 的平均响应时间相对缩短了 99 %。
进行迁移
毫无疑问,从专有Unix系统迁出存在一定风险,但我们的系统(例如戴尔展示过的系统)确实能够以更优惠的价格提供同样出色甚至更优秀的性能,并能与整个数据中心采用相同的技术。
来源资料:dell&intel ftp://182.92.236.18/xstor/down/dell_10_1201.pdf