Amazon S3

Amazon S3 Vectors

成本优化的人工智能就绪型存储，原生支持大规模存储和查询向量

创建免费账户

在控制台中管理

什么是 S3 Vectors？

Amazon S3 Vectors 为人工智能代理、人工智能推理以及存储在 Amazon S3 中内容的语义搜索提供专门构建、成本优化的向量存储和查询功能。S3 Vectors 让创建和使用大型向量数据集变得经济高效，从而改善人工智能代理的记忆和上下文，以及 S3 数据的语义搜索结果。S3 Vectors 旨在提供与 Amazon S3 相同的弹性、扩展性和持久性，让您可以存储数十亿向量并以亚秒级查询性能搜索数据。使用 S3 Vectors，您可以受益于一套专用的 API 来存储、访问和查询向量，无需预置任何基础设施。它非常适合需要大规模构建和维护向量索引的应用程序，让您能够组织和搜索海量信息。

优势

降低上传、存储和查询向量的成本，同时保持亚秒级查询性能。告别昂贵的存储选项，只为实际使用量付费，从而彻底转变存储数百万至数十亿向量的存储成本结构。无需基础设施管理即可高效扩展海量向量，使用向量索引组织数据，无需资源预置即可适应不断变化的工作负载。S3 Vectors 专为向量驱动的人工智能使用案例而设计，提供了性能与效率的务实平衡。

生成细粒度向量嵌入，从包括图像、视频、音频和文本在内的非结构化数据中获得更深入的理解。为向量搜索应用程序进行弹性扩展，以基于语义相似性提高粒度。无论是分析新闻内容、索引体育精彩片段，还是处理医学图像和基因组数据，S3 Vectors 都能以一致的查询性能和灵活的扩展能力支持高吞吐量工作负载。

将 S3 Vectors 用于不需要内存向量数据库高吞吐量性能的大型、长期向量数据。Amazon OpenSearch Service 提供实时应用所需的高 QPS（每秒查询次数）、低延迟向量搜索，而 S3 Vectors 则通过提供成本优化的数据基础来补充这一点，其查询性能针对长期存储和低频数据访问进行了优化。您还可受益于具有强一致性保证的存储架构，确保后续查询始终包含您最近添加的数据。

使用案例

基于语义和相似性精确定位搜索结果

对大量向量数据集执行语义和相似性搜索。媒体机构可以索引数百万小时的视频，即时呈现精彩片段的相关场景，而医疗机构可以存储代表医学图像的数十亿向量嵌入，以识别相似病例并加速诊断。使用 S3 Vectors，您可以用更低的成本释放非结构化数据的语义价值，同时不影响扩展性。

降低检索增强生成（RAG）成本

使用 S3 Vectors 降低 RAG 成本。通过 RAG 应用程序，将您的专有数据集转变为具有上下文感知能力的智能知识库。借助 S3 Vectors 中可扩展、经济高效的向量存储，快速构建和定制生成式人工智能应用程序，并通过 API 和 SDK 将其与您选择的基础模型和知识库解决方案集成。

构建具有扩展和持久记忆的更智能人工智能代理

通过保留更多上下文、使用更丰富的数据进行推理，以及从经济高效的大规模向量存储中构建持久记忆，让您的人工智能代理更加智能。以低成本存储 PB 级向量数据中的每一次交互、文档和洞察，避免代理被强制遗忘有价值的上下文。支持持续学习、历史上下文回溯、模型重训练和微调，持续深化智能代理的推理能力。无论是用于代理记忆还是跨大规模人工智能数据集的相似性搜索，S3 Vectors 都为任意规模的向量存储和检索提供了经济高效的数据基础。

适用于任意规模开发的人工智能就绪型存储

存储并快速访问任意数量的向量数据，快速启动您的人工智能项目。无需基础设施设置，S3 Vectors 让您可以立即让数据发挥作用并开始人工智能开发。它还能够满足复杂人工智能应用程序对存储的严苛要求。无论您是在构建个性化引擎、自然语言处理系统，还是在大型代码库中导航，S3 Vectors 都能提供成本优化的人工智能就绪型存储，并可根据您的需求进行扩展，从原型到生产，加速人工智能创新的每一步。

summit-wk21

2026 亚马逊云科技中国峰会｜AI 联赛 · 极客竞技场 6 月 23-24 日上海世博中心｜倒计时 2 天，亲临高燃竞技现场！见证硬核技术对决，加入属于开发者与构建者的互动狂欢

立即预约参会

Amazon S3 Vectors

什么是 S3 Vectors？

优势

使用案例

基于语义和相似性精确定位搜索结果

降低检索增强生成（RAG）成本

构建具有扩展和持久记忆的更智能人工智能代理

适用于任意规模开发的人工智能就绪型存储

关于我们

产品与解决方案

资源与支持

管理账户

Amazon S3 Vectors

什么是 S3 Vectors？

优势

成本优化向量存储

大规模访问向量数据以实现更细粒度的搜索

为大型向量数据集提供优化的性能

使用案例

基于语义和相似性精确定位搜索结果

降低检索增强生成（RAG）成本

构建具有扩展和持久记忆的更智能人工智能代理

适用于任意规模开发的人工智能就绪型存储

关于我们

产品与解决方案

资源与支持

管理账户