使用 S3 生命周期精确管理对象生命周期

发布时间 2023-08-27 00:19:12作者: 亚马逊云开发者

在亚马逊工作这些年,我发现 S3 的生命周期配置是管理对象生命周期的重要但复杂的工具。在这篇文章中,我将利用实战经验,深入剖析生命周期,从核心概念到实际应用。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

 

导言

在云存储中管理数据生命周期至关重要却很复杂。随着大量数据快速累积,不受控制的增长会导致成本指数上升。S3 生命周期让我们可以建立自动化策略,在存储类型之间转变对象或删除对象。

本文将详细剖析生命周期,从基础逻辑到实际配置。您将学习如何精确控制对象生命周期的同时优化存储成本。本文将提供示例并辅以流程图和图解进行步骤详解。我的目标是提供可直接实施的见解,应用于您的云架构中。

背景知识

首先简述几个关键概念:

S3 生命周期策略对满足特定条件的对象应用规则。每个规则定义在对象生命周期的某些点上满足标准时要执行的操作。

常见条件包括:

  • 对象键名称前缀或标签
  • 对象创建日期
  • 总生命周期天数

典型操作包括:

  • 转变存储类型
  • 终止未完成的多部分上传
  • 永久删除对象

实际上,生命周期基于定义的规则,自动在 S3 存储类型之间转变对象,或完全删除对象。

问题所在

生命周期为什么有用且复杂?

不受控制的数据累积会迅速增加云存储成本。临时手动干预操作既费力又容易出错。生命周期提供自动化,但制定有效精确的规则需要深入理解。

错误配置可能导致意外转变或删除。复杂访问模式,比如每天数百万次上传/访问,进一步增加了策略设计的难度。

因此,掌握生命周期的逻辑和复杂度是必须的。

S3 生命周期的工作原理

让我们逐步看一下生命周期配置:

 

2-1. lifecycle-transitions-v3.png

1. 定义生命周期规则

根据名称、标签或创建日期为对象制定规则过滤器。

2. 指定操作

选择在匹配对象上执行的操作,比如转变存储类型或删除。

3. 评估对象

S3 定期根据规则评估对象。匹配的对象进入指定操作的队列。

4. 执行操作

对于等待操作的对象,在达到下一个计划间隔时,S3 会执行指定的操作。

总之,生命周期基于细致的规则自动转变或删除对象。但是设计高效可预测的策略需要考虑周全.

关键优势与应用

生命周期的强大之处在哪里?

成本优化:极少访问的数据转变到低频或冷存储,可节省高达 90% 的存储成本。直接删除不需要的数据。

存储分层:根据访问模式自动在存储类型之间迁移数据。例如,30天后访问日志转变到低频存储。

清理工作:在指定天数后终止未完成的多部分上传,以节省成本。

合规性:根据数据保留政策,在达到规定保存期限后,永久删除敏感数据。

简而言之,生命周期实现从创建到删除的细致自动化数据控制,有效管理存储增长。

实际应用示例

下面我们看一些演示实际使用的生命周期示例:

优化存储成本

30天后日志转变到低频存储,365天后删除:

<LifecycleConfiguration>
  <Rule>
    <Filter>
       <Prefix>logs/</Prefix>
    </Filter>
    <Transitions>
       <Transition>
          <Days>30</Days>
          <StorageClass>STANDARD_IA</StorageClass>
       </Transition>
    </Transitions>
    <Expiration>
       <Days>365</Days>
    </Expiration>
  </Rule>
</LifecycleConfiguration>

自动数据分层

90天后 tax/ 开头的对象转变到冷存储以归档:

<Rule>
  <Filter>
     <Prefix>tax/</Prefix>
  </Filter>
  <Transitions>
     <Transition>
        <Days>90</Days>
        <StorageClass>GLACIER</StorageClass>
     </Transition>
  </Transitions>
</Rule>

删除未完成的多部分上传

7天内未完成的上传过期以节省成本:

<Rule>
   <Filter>
      <And>
        <Prefix>uploads/</Prefix>
        <ObjectState>Multipart</ObjectState>
     </And>
   </Filter>
   <Expiration>
     <Days>7</Days>
   </Expiration>
</Rule>

主要精髓

让我们总结学习要点:

  • 生命周期通过细致规则自动转变和删除对象
  • 匹配访问模式实现成本优化,避免不受控制的增长
  • 精确的策略设计需要深入理解,以防意外后果
  • 实际示例演示了常见应用,比如分层、清理和保留

希望这些见解有助于您掌握生命周期的复杂度,并有效实施,也欢迎您可以分享您的问题和应用经验。我们社区的集体智慧将加深我们所有人的理解。

参考资料

文章来源:https://dev.amazoncloud.cn/column/article/64e5cb3384d23218430681eb?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=bokey