痛点:
传统Hadoop集群采用融合架构,绑定计算与存储资源,在初始规划和后期扩容中都造成资源浪费。部分场景中数据需要6个月以上长存期更造成集群规模大幅上升。客户被迫购买大量堆叠的服务器,和由此带来的高昂电费。
方案:
捷誊推出存算分离架构一体机方案,让计算集群和存储集群可以按需分别扩展。方案的核心是采用捷誊JetLake分布式存储软件,以与HDFS全兼容的形式安全运行Hadoop生态主流组件,如Hadoop/Spark MR, HBase及多种SQL引擎(Hive/Impala/Presto等):无需改动,也无性能下降。
捷誊大数据一体机采用其他捷誊产品以大幅提高差异化:
JetLake纠删码:把存储裸容量从2副本的100%开销和3副本的200%开销,降低到10-20%的开销;
压缩卡:提供比Sappy高30-40%的压缩比,及相当的压缩速度;
加密卡:满足国密改造要求。
SSD: 存放Shuffle, 中间数据,及全局缓存,以大幅加速分布式计算。
价值:
在综合创新下,捷誊大数据一体机在典型场景中可比传统方案件降低一半裸容量,一半CPU总核数,和数倍的机架空间。