开源对存储行业的影响是巨大的,过去是这样,现在是这样,以后更不会减少。
出于简单的原因,开发人员社区是最大的社区,采用范围非常广泛。有些人认为这是一种威胁,而另一些人则认为该模型是一种相信另一种方法的自主努力。让我们深入一点。
首先在存储之外,这是我们每天直接或间接使用的一些开源软件(OSS)项目的列表:当然是Linux和FreeBSD,Kubernetes,OpenStack,Git,KVM,Python,PHP,HTTP服务器,Hadoop,Spark ,Lucene,Elasticsearch(双重许可),MySQL,PostgreSQL,SQLite,Cassandra,Redis,MongoDB(在SSPL下),TensorFlow,Zookeeper或一些著名的工具和产品,如Thunderbird,OpenOffice,LibreOffice或SugarCRM。
当然,这个列表非常长,在我们的世界中非常多样化且无处不在。这些项目中的一些引发了公司创建的热潮,因为他们期望市场创建和潜在的统治。其中有Cloudera和Hortonworks,它们都公开上市,促进了Hadoop,并于2019年合并。MariaDB作为MySQL的分支,当然后来被Oracle收购了MySQL。DataStax for Cassandra,但事实证明,这并非总是安全的命运……
Coldago Research估计,到2021年,整个开源行业将代表27+十亿美元,到2024年将超过350亿美元的壁垒。
历史上,其根源之一来自Unix – Linux过渡。实际上,Unix被广泛使用和采用,但是代表了一定的价格,并且源代码的成本很高,甚至高得令人望而却步。在大学和研究中心开发和研究的诸如Minix和Linux之类的项目吸引了大量的用户和采用者,其中许多人都是参与者。它是否类似于宗教,也许不是但肯定是一种哲学。Red Hat成立于1993年,已经证明开源业务可以发展壮大并为长期发展做好准备。该公司于1999年进行IPO,年营业额约为30亿美元。该公司于2019年被IBM以340亿美元的价格收购,这是令人惊讶的权利。Canonical,SUSE,Debian和其他一些公司或公司或社区也显示出有趣的发展道路。
在此之前,软件开发本质上是应用程序,因为系统软件意味着成本和高成本。另外,一家初创公司没有用他们筹集的风险投资来购买软件,因为这可能被视为超出其使命的自杀。所有这些都在各个方向上推动了开源浪潮。
在存储方面,Linux邀请学生,研究中心,社区和初创公司开发系统软件,尤其是块存储方法和文件系统以及诸如对象存储软件之类的其他软件。因此,我们都知道许多利用Linux提供此类新存储模型的存储软件初创公司。总体上,我们没有看到很多块存储,但是包含块(基于SCSI)存储的更开放源代码的操作系统。对于具有大量产品的文件和对象存储,这有点不同。
在文件存储方面,该列表对于磁盘文件系统和分布式文件系统而言非常重要,后者也具有多个子段。
下面是存储世界中相当长的OSS列表。
块存储 | Linux-LIO,Linux SCST和TGT,Open-iSCSI,Ceph RBD,OpenZFS,Linbit DRBD,NexentaStor(Community Ed。),Openfiler,Chelsio iSCSI,Open vStorage,CoprHD,OpenStack Cinder |
档案储存 |
磁盘文件系统:XFS,OpenZFS,Reiser4(ReiserFS),ext2 / 3/4 分布式文件系统(包括群集,NAS和并行,以简化列表):Lustre,BeeGFS,CephFS,LizardFS,MooseFS,RozoFS,XtreemFS,CohortFS,OrangeFS(PVFS2),Ganesha,Samba,Openfiler,HDFS,Quantcast,Sheetdog,GlusterFS ,JuiceFS,ScoutFS,Red Hat GFS2,GekkoFS,OpenStack马尼拉 |
对象存储 | Ceph RADOS,MinIO,Seagate CORTX,OpenStack Swift,英特尔DAOS |
其他数据管理和存储相关项目 | TAR,rsync,OwnCloud,FileZilla,iRODS,Amanda,Bacula,Duplicati,KubeDR,Velero,Pydio,Grau Data OpenArchive |
开源的影响不仅对商业软件而且对其他新兴的或较小的OSS足迹都是显而易见的。所谓影响力,是指采用激进的新方法破坏现有的市场地位。嵌入开放源代码的商业软件或著名的广泛采用的开放源代码产品也可以说明这一点,从而阻止了一些主动行动。在所有这些方案中,我们可以列出XFS,OpenZFS,Ceph和MinIO,它们会动摇商业模型,甚至由不需要自行开发或与潜在合作伙伴签署任何OEM交易的供应商选择。就像我们在过去多次说过的那样,建立,购买或合作伙伴模型在该世界中也已成为现实。为了扩展这些示例,建议将Ceph与XFS磁盘文件系统一起部署用于OSD(如OpenStack Swift)。
正如最后几个示例所示,显然开源项目具有类似的优势,可以利用其他开源软件,商业软件,但我们从未见过利用商业软件的开源项目。这有点矛盾。这是启动开发提供相同功能的开源项目的触发条件。
Delphix,Oracle和TrueNAS也使用OpenZFS。MinIO由嵌入TrueNAS,Datera,Humio,Robin.IO,McKesson,MapR(现为HPE),Nutanix,Pavilion Data,Portworx(现为Pure Storage),Qumulo,Splunk,Cisco,VMware或Ugloo中的iXsystems选择。 。SoftIron利用Ceph并围绕它构建优化的量身定制的系统。清单很长……我们都想到了几个例子。
开源播放器基本上围绕社区和企业版来推广其解决方案,区别在于支持费用,补丁策略,功能差异以及最终订阅费用。众所周知,创新通常来自于敏捷的小企业,他们在接触大客户时确实遇到困难,并且对他们的寿命存有疑问。选择OSS路径是大型提供商或用户直接嵌入和选择的一种方式,这暗示了围绕业务模型的一些关键问题。
对商业软件的影响的另一个方面与大学或研究中心的行为有关。他们更喜欢通过使用开源来增加硬件预算,并减少一种软件。这些实体有很多技术人员(可能有时间)来开发和扩展开源项目,并回馈社区。他们看到以这种方式工作的积极良性循环,每个人都在喂养别人。因此,他们在性能提高,计算能力方面达到了新的水平……最终在预算约束和压力下可以理解的决定。Ceph是在UCSC的Sage Weil论文期间由高级模拟和计算程序(ASC)发起的,其中包括Sandia国家实验室(SNL),Lawrence Livermore国家实验室(LLNL)和Los Alamos国家实验室(LANL)。这有很多 著名的例子有Lustre,还有来自LANL的MarFS,来自德国美因茨大学的GekkoFS,以及与巴塞罗那超级计算中心或BeeFFS(前身为FhGFS)相关的组织,后者也由德国的弗劳恩霍夫高性能计算中心开发。Lustre是由Peter Braam于1999年在卡内基梅隆大学创立的。项目随处可见。
作为存储扩展的协作软件会出现类似的行为。OwnCloud是一种开源文件共享和协作软件,已被许多大学和大型教育机构使用和选择。
同时,选择开源组件或产品来实现独立性并不能提供任何生命保障。记住示例,例如HDFS,GlusterFS,OpenIO,NexentaStor或Redcurrant。他们中的一些人被收购或消失了,并给用户带来了麻烦,但可以肯定的是,其他玩家有机会仔细观察该空间。如果对未来存在一些疑问,可以采取一些措施来保护软件。
SDS浪潮,有点像LMAP(Linux,MySQL,Apache Web服务器和PHP),对商业软件产生了严重影响,一些开放源代码的播放器或解决方案跳入其中,极大地侵蚀了价格。这种对用户有利的举措,也继续减少了玩家之间的差异,并且变得更加难以察觉差异。
此外,互联网巨头在开源开发中也发挥了重要作用。他们拥有人才,庞大的团队,时间和金钱,可以花时间开发完全适合他们需求的软件。他们还控制着社区的行动,因为他们向多个方向投放种子。另一个原因是很难找到可以满足其需求的商业软件。换句话说,商业软件可以扩展到大型公司的需求,但对于大型互联网播放器却达到了一些限制。从历史上看,这些组织确实使用商业软件找不到或不可能的新设计和方法来重新定义可扩展性目标。我们所有人都想着例子,在存储方面,Google File System是Facebook上的经典之作或Haystack。
开源立即与各种许可证模型相关联,这是源代码的复杂方面,因为它继续给某些影响项目未来的人员和实体带来困难。那时,有关ZFS甚至Java的文章在媒体上已经被很好地报道了。我们邀请读者来检查他们的首选页面为或至少访问维基百科的一个或这一个阑尾页面上的全表。
与许可证有直接关系的是社区,组织或基金会,由于清单很长,我们可以在此提及其中一些:Apache软件基金会,Cloud Native Computing Foundation,Eclipse基金会,自由软件基金会,FreeBSD基金会,Mozilla基金会或Linux基金会...并再次维基代表一个很好的源启动。
开源是一个漫长的故事,并且会持续存在……