掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

为极致的视频体验而设计:facebook新一代存储平台Bryce Canyon架构

在 Facebook,我们的存储需求不断演进。 为了在运行工作负载时更高效,我们一直致力于优化我们的存储服务器设计。 2013 年,我们与设计合作伙伴 Wiwynn 合作,将第一个存储机柜 Open Vault(Knox)提供给开放计算项目(Open Compute Project),然后在 2015 年利用该设计创建了我们的存储服务器 Honey Badger,还有 2016 年的 Lightning NVMe 机柜。

由于重点关注我们的应用程序的视频体验,存储的工作负载越来越需要更多的存储容量和密度。 我们开始设计我们的下一代存储,关注效率和性能,并于今天宣布,我们最新的存储平台 Bryce Canyon 的设计规范现在可通过开放计算项目(Open Compute Project)获取。

876-640.jpg.jpg

Bryce Canyon 将主要用于高密度存储,包括照片和视频,并提供比 Open Vault 高 20% 的硬盘驱动器(HDD)密度。它被设计为支持更强大的处理器和更大的内存,它通过在底盘下方吸入空气来提高热和电源效率。

我们的目标是建立一个平台,不仅能满足我们今天的需求,还能扩展以适应未来增长的新模块。 Bryce Canyon 提供了强大的分类存储功能,与其他存储平台相比可以轻松扩展。

Bryce Canyon 存储系统支持 72 个 3.5 英寸硬盘(12 Gb SAS/6 Gb SATA)。系统可以配置为单个 72 驱动器存储服务器,或者作为具有完全独立电源的双 36 驱动器的存储服务器,或作为 36/72 驱动器的 JBOD(just a bunch of disks,一堆磁盘)。由于它减少了我们将来支持的存储平台配置数量,这种灵活性进一步简化了我们的数据中心操作。

当配置为存储服务器时,Bryce Canyon 支持单或双 Mono Lake CPU 模块。我们发现,对于某些工作负载(如 Web 和存储),单插槽架构更高效,每瓦性能更高;我们以前改变了我们的 Web 层来利用这种架构,并在 Bryce Canyon 平台上实现了相同的 Mono Lake 构建块。

驱动器连接由存储控制器卡(SCC)提供,在此迭代中提供 12 Gb SAS / 6 Gb SATA 连接接口。对于前端连接,有一个包含 OCP 夹层 NIC 的输入/输出模块(IOM),它支持 25 Gb 和 50 Gb 网卡。目前有 IOM 的两个变体:一个具有 2 x 四通道 M.2 模块,一个具有12Gb SAS 控制器。通过填充不同的模块,Bryce Canyon 可以通过多种方式进行配置,以优化各种用例,如 JBOD,Hadoop,冷存储等。

Bryce Canyon 完全符合 Open Rack v2 标准,并且利用了 OCP 硬件产品中的许多构建块。该系统通过 OpenBMC 进行管理,可以兼容 Facebook 数据中心中大多数新硬件的通用管理框架。 CPU 模块是 Mono Lake 卡,并且支持包括 25 Gb 和 50 Gb OCP 夹层 NIC。

877-640.jpg.jpg

模块化和灵活的平台

由于模块化设计,未来的平台可以采用下一代 CPU 模块,以在新技术采用时提高性能。 如果需要其他输入/输出接口,可以设计一个新的 I/O 模块以满足需要。 通过 16 条 PCIe 通道进入 IOM,大量的带宽可用于支持各种可能性。 该系统设计为协议无关的,所以如果需要 NVMe 系统,存储控制器卡就可以换成一个基于 PCIe 交换机解决方案。


支持不同工作负载的灵活性


高性能工作负载

对于大功率配置(如用于我们的某个分类存储服务的配置),Bryce Canyon 配置了两个 Mono Lake CPU 模块,以在同一机箱内创建两个独立的 36 驱动器存储服务器。 除了 OCP 夹层 NIC,此配置中使用的 I/O 模块支持两个 PCIe M.2 插槽,四个 PCIe Gen 3 通道。 M.2 插槽可用于缓存或合并写入。

平衡工作负载

对于每个驱动器需要较少 CPU 性能的存储系统(由于容量大和读/写速率低),可以使用单个 Mono Lake 连接到系统中的所有 72 个驱动器。

最大容量

对于需要超过 72 个驱动器存储空间的应用程序(例如,存档用例),您可以将多个 Bryce Canyon JBOD 以菊花链形式连接到 Bryce Canyon 头节点或外部服务器。

878-640.jpg.jpg

专用数据中心 - 规模化部署

由于无工具的设计,Bryce Canyon 系统可以快速而简单的上线服务。 系统中的每个主要 FRU 可以在不使用工具的情况下更换 - 它们包含在闩锁或指旋螺钉中。 该设计最独特的一个方面是无需工具的驱动器固定系统,不需要任何托架:系统使用闩锁机构来保持裸驱动器。为了移除存储器,闩锁通过将驱动器部分地拉出系统来帮助用户,以便于操作。 该系统大大简化了部署和维护。

Bryce Canyon 的设计规范通过开放计算项目(Open Compute Project)公开提供,全面的硬件设计文档将近期发布。请关注高可用架构留意后续文章。

                              230-640.jpg.jpg

原文来自:高可用架构

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 全球天气预报

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

  • 购物小票识别

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

  • 涉农贷款地址识别

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

  • 人脸四要素

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

  • 个人/企业涉诉查询

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

0512-88869195
数 据 驱 动 未 来
Data Drives The Future