返回资讯列表

AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力

亚马逊云科技发布第四代ARM架构处理器Graviton4,提供更高性能和能效,并加入专用AI加速器,为云计算工作负载带来全新水平的性价比

2024/7/20
2189 浏览量
云计算
AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力
#处理器 #Graviton #ARM #高性能计算 #AI加速

AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力

亚马逊云科技(AWS)今日宣布推出第四代ARM架构处理器Graviton4,这是AWS自研芯片家族的最新成员,为云计算工作负载提供了显著的性能、效率和成本优势。Graviton4不仅在通用计算性能上实现了大幅提升,还首次加入了专用AI推理加速器,为机器学习应用提供更强大的支持。

性能与架构突破

Graviton4处理器展现了多项关键性能指标的显著提升:

  • 较Graviton3提升高达**30%**的整体性能
  • 单线程性能提升25%
  • 浮点性能提升40%
  • 每瓦性能提升35%(能效)
  • AI推理性能比Graviton3快4倍
  • 支持高达96个vCPU核心(比Graviton3的64核增加50%)
  • 带宽比Graviton3提升33%

Graviton4基于Arm Neoverse V2内核架构,还采用了多项定制优化,包括:

  • 增强的分支预测器
  • 扩展的指令重排序窗口
  • 更大的L1和L2缓存
  • 改进的内存子系统
  • 专用神经网络加速引擎

适配的工作负载

Graviton4处理器专为多种高性能云工作负载优化:

通用计算工作负载

  • Web服务与微服务(Java、Go、Python、Node.js等)
  • 容器化应用和Kubernetes工作负载
  • 开源数据库(MySQL、PostgreSQL、Redis等)
  • 内存缓存和分布式缓存系统
  • 高性能计算(HPC)应用

AI和机器学习

  • 大规模机器学习推理
  • 自然语言处理服务
  • 图像识别和计算机视觉
  • 实时推荐系统
  • 时间序列分析和预测

支持的AWS实例与服务

Graviton4将为以下AWS实例和服务提供支持:

  • Amazon EC2 R8g实例 - 内存优化型实例,针对内存密集型工作负载
  • Amazon EC2 C8g实例 - 计算优化型实例,针对高性能计算
  • Amazon EC2 M8g实例 - 通用型实例,平衡计算、内存和网络资源
  • Amazon RDS - 提高数据库性能,降低成本
  • Amazon ElastiCache - 加速缓存性能
  • Amazon EKS - 优化容器工作负载
  • AWS Lambda - 提高无服务器计算效率

首批基于Graviton4的EC2 R8g实例现已在AWS预览计划中提供,支持多种实例大小,从r8g.medium(1 vCPU)到r8g.48xlarge(96 vCPU)。

实际性能表现

AWS和早期客户的基准测试显示了Graviton4的显著性能优势:

数据库性能

与Graviton3相比:

  • MySQL性能提升29%
  • PostgreSQL性能提升27%
  • Redis性能提升33%
  • Cassandra吞吐量提升35%

Web服务器和应用框架

与Graviton3相比:

  • NGINX请求处理提升28%
  • Apache HTTP Server提升26%
  • Spring Boot应用提升31%
  • Django应用提升29%

AI推理性能

支持多种AI框架的高效推理:

  • PyTorch模型推理速度提升4.2倍
  • TensorFlow模型推理速度提升3.8倍
  • ONNX Runtime性能提升4倍

客户反馈:金融服务与电商

多家企业已在预览阶段体验了Graviton4的性能:

"作为一家大型金融服务公司,我们需要高性能、低延迟的计算来处理实时交易和风险分析。在预览期间,我们的风险模拟工作负载在Graviton4上比Graviton3快了约30%,同时成本降低约20%。更令人兴奋的是,我们的机器学习风险评估模型在Graviton4的AI加速器上运行速度提高了近4倍,这显著改善了我们的实时决策能力。"
— 某全球金融机构技术架构副总裁

"我们的电子商务平台在季节性高峰期需要大规模扩展。在测试中,我们的容器化微服务在Graviton4上比Graviton3快28%,我们的推荐引擎性能提升超过3倍。这意味着我们可以使用更少的实例处理相同的流量,降低成本的同时提供更佳的客户体验。迁移过程也很简单,因为我们的应用已经在Graviton3上运行良好。"
— 某大型电商平台首席技术官

开发者生态系统

AWS继续扩展Graviton生态系统,使迁移更加简单:

  • 目前已有超过80万个应用和服务在Graviton上运行
  • 超过12,000个开源软件包优化支持ARM架构
  • 所有主流编程语言和框架(Java、Python、Go、Node.js、.NET等)都可本地运行
  • 提供完整的开发工具链,包括编译器、调试器和性能分析工具
  • AWS Graviton Fast Start计划提供迁移支持和最佳实践

ARM架构的持续发展

自2018年首次推出Graviton处理器以来,AWS已成为ARM服务器架构采用的领导者:

  • Graviton (2018) - 首代ARM处理器
  • Graviton2 (2020) - 比第一代性能提高7倍
  • Graviton3 (2022) - 比Graviton2提高25%性能
  • Graviton4 (2024) - 比Graviton3提高30%性能,新增AI加速

这一发展轨迹证明了ARM架构作为数据中心和云计算处理器的可行性和性能潜力。

能效与可持续发展影响

Graviton4处理器对AWS可持续发展承诺做出了重要贡献:

  • 每瓦性能比Graviton3提高35%
  • 每vCPU平均功耗降低20%
  • 帮助AWS数据中心减少碳足迹
  • 使客户能够降低计算工作负载的环境影响
  • 支持AWS到2025年实现100%可再生能源供电目标

优化工作负载的最佳实践

AWS提供了多种资源,帮助客户在Graviton4上获得最佳性能:

  1. 应用评估 - 确定哪些应用最适合迁移到Graviton4
  2. 代码审核 - 检查与架构相关的依赖和优化点
  3. 性能测试 - 比较ARM和x86实例上的应用性能
  4. 逐步迁移 - 使用蓝绿部署策略安全迁移工作负载
  5. 架构优化 - 利用Graviton4特性调整应用架构

详细的最佳实践文档可在AWS Graviton开发者门户获取。

定价与成本优势

基于Graviton4的实例提供显著的价格性能优势:

  • 较同等x86实例节省**20-40%**的成本
  • 较Graviton3实例降低约**10%**的每vCPU成本
  • 内置AI加速器不额外收费
  • 支持EC2 Spot实例,可提供额外高达70%的成本节约

最终定价将在实例正式发布时公布。

全球可用性

AWS计划在2024年后期在全球主要AWS区域陆续推出基于Graviton4的EC2 R8g实例:

  • 美国:弗吉尼亚北部、俄亥俄、俄勒冈
  • 欧洲:爱尔兰、法兰克福、伦敦
  • 亚太:东京、新加坡、悉尼
  • 其他区域将在2025年初逐步上线

入门指南

对Graviton4感兴趣的客户可以通过以下方式开始:

  1. 申请加入EC2 R8g预览计划
  2. 利用AWS Graviton Fast Start计划和资源
  3. 使用AWS Graviton Ready探索器评估应用兼容性
  4. 参考Graviton开发者文档
  5. 参加AWS提供的Graviton4开发者网络研讨会

结论

AWS Graviton4处理器代表了AWS芯片设计能力的又一次重大飞跃,为客户提供卓越的性能、效率和成本优势。通过增加专用AI加速功能,Graviton4不仅加强了传统工作负载的处理能力,还为机器学习应用提供了显著的性能提升。

随着云计算工作负载对性能和效率要求的不断提高,Graviton4展现了自定义芯片如何为特定需求提供优化解决方案。对于寻求降低成本同时提高计算性能的企业而言,Graviton4代表了云计算基础设施的未来发展方向。

分享: