第023题 - sap
天使星云NGC 2170的抽象艺术
图片来源和版权:David Moulton
说明:这是一幅画还是一张照片?在这幅用宇宙画笔创作的天体抽象艺术作品中,布满尘埃的星云NGC 2170,也被称为天使星云,在图像中心上方闪闪发光。NGC 2170周围是一些蓝色的反射星云,反射着附近热恒星的光,以及红色的发射区、许多暗吸收星云和彩色的背景恒星。这个巨大的、正在形成恒星的分子云位于麒麟座中,就像抽象画家经常选择作为他们主题的常见家居物品一样,这样的气体云、尘埃和热恒星也经常出现在类似的照片布局中。巨大的分子云Mon R2离我们非常近,估计只有2400光年左右。在这个距离上,这幅画布的宽度超过60光年。
问题翻译 (Question Translation)
English: A company is running a data-intensive application on AWS. The application runs on a cluster of hundreds of Amazon EC2 instances. A shared file system also runs on several EC2 instances that store 200 TB of data. The application reads and modifies the data on the shared file system and generates a report. The job runs once monthly, reads a subset of the files from the shared file system, and takes about 72 hours to complete. The compute instances scale in an Auto Scaling group, but the instances that host the shared file system run continuously. The solutions architect needs to reduce costs by replacing the shared file system instances. The file system must provide high performance access to the needed data for the duration of the 72-hour run. Which solution will provide the LARGEST overall cost reduction while meeting these requirements?
中文翻译: 一家公司在 AWS 上运行一个数据密集型应用程序。该应用程序在数百个 Amazon EC2 实例的集群上运行。共享文件系统还在多个 EC2 实例上运行,存储 200 TB 的数据。该应用程序读取和修改共享文件系统上的数据并生成报告。作业每月运行一次,从共享文件系统中读取一部分文件,并需要大约 72 小时才能完成。计算实例在自动扩展组中缩放,但托管共享文件系统的实例持续运行。解决方案架构师需要通过替换共享文件系统实例来降低成本。文件系统必须在 72 小时的运行时间内为所需数据提供高性能访问。哪种解决方案将提供最大的整体成本降低,同时满足这些要求?
选项分析 (Answer Analysis)
选项 A
Migrate the data from the existing shared file system to an Amazon S3 bucket that uses the S3 Intelligent-Tiering storage class. Before the job runs each month, use Amazon FSx for Lustre to create a new file system with the data from Amazon S3 by using lazy loading. Use the new file system as the shared storage for the duration of the job. Delete the file system when the job is complete. 将数据从现有共享文件系统迁移到使用 S3 智能分层存储类的 Amazon S3 存储桶。在每月作业运行之前,使用 Amazon FSx for Lustre 创建一个新的文件系统,该文件系统使用懒加载从 Amazon S3 中获取数据。将新文件系统用作作业持续期间的共享存储。作业完成后删除文件系统。
分析:
- 优点:
- S3 Intelligent-Tiering 可以根据访问模式自动调整成本,并降低长期存储费用。
- FSx for Lustre 可以提供高性能的文件系统。
整体成本降低潜力体现较好。
选项 B
Migrate the data from the existing shared file system to a large Amazon Elastic Block Store (Amazon EBS) volume with Multi-Attach enabled. Attach the EBS volume to each of the instances by using a user data script in the Auto Scaling group launch template. Use the EBS volume as the shared storage for the duration of the job. Detach the EBS volume when the job is complete. 将数据从现有共享文件系统迁移到一个大的 Amazon Elastic Block Store (Amazon EBS) 卷,启用多重附加。通过在自动扩展组启动模板中使用用户数据脚本将 EBS 卷附加到每个实例。将 EBS 卷用作作业执行期间的共享存储。作业完成后卸载 EBS 卷。
分析:
- 缺点:
- EBS 不是用于大规模共享访问的最佳选择,且相对成本较高。
- 除非实例极少,否则多次附加可能导致性能瓶颈。
整体成本效益不如选项 A。
选项 C
Migrate the data from the existing shared file system to an Amazon S3 bucket that uses the S3 Standard storage class. Before the job runs each month, use Amazon FSx for Lustre to create a new file system with the data from Amazon S3 by using batch loading. Use the new file system as the shared storage for the duration of the job. Delete the file system when the job is complete. 将数据从现有共享文件系统迁移到使用 S3 标准存储类的 Amazon S3 存储桶。在每月作业运行之前,使用 Amazon FSx for Lustre 创建一个新的文件系统,该文件系统使用批量加载从 Amazon S3 中获取数据。将新文件系统用作作业执行期间的共享存储。作业完成后删除文件系统。
分析:
- 缺点:
- S3 标准存储类对于不频繁访问的数据可能不太划算,且无法根据访问模式自动优化成本。
在成本优化方面,整体潜力低于选项 A。
选项 D
Migrate the data from the existing shared file system to an Amazon S3 bucket. Before the job runs each month, use AWS Storage Gateway to create a file gateway with the data from Amazon S3. Use the file gateway as the shared storage for the job. Delete the file gateway when the job is complete. 将数据从现有共享文件系统迁移到 Amazon S3 存储桶。在每月作业运行之前,使用 AWS Storage Gateway 创建一个文件网关,并使用来自 Amazon S3 的数据。将文件网关用作作业的共享存储。作业完成后删除文件网关。
分析:
- 缺点:
- AWS Storage Gateway 增加了额外的管理和维护成本。
- 在性能调优方面可能不如 FSx for Lustre。
成本效益较差。
最佳答案 (Correct Answer)
答案:A
详细解析 (Detailed Explanation)
1. 为什么选择 A?
- 成本效率与性能结合:
- S3 Intelligent-Tiering 提供了更加合理的存储费用,而 FSx for Lustre 可以提供所需的高性能访问,适合数据处理。
- 在每月作业期间仅付费使用高性能计算资源,降低长期成本。
2. 为什么不选择其他选项?
- **B:**EBS 通常更适用于小范围、低并发的访问,而 S3 的设计更适合大规模的读写。
- **C:**S3 标准存储类不够灵活,未能真正优化存储成本。
- **D:**使用 Storage Gateway 可能增加了不必要的开销和复杂性,整体性价比低。
总结 (Summary)
选择 A 不仅能确保当前项目需求的高性能访问,还能在长期存储和处理方面提供最大的成本降低。
如有其他问题,请继续询问!