什么是 S3 Vectors?
Amazon S3 Vectors 为人工智能代理、人工智能推理以及存储在 Amazon S3 中内容的语义搜索提供专门构建、成本优化的向量存储和查询功能。S3 Vectors 让创建和使用大型向量数据集变得经济高效,从而改善人工智能代理的记忆和上下文,以及 S3 数据的语义搜索结果。S3 Vectors 旨在提供与 Amazon S3 相同的弹性、扩展性和持久性,让您可以存储数十亿向量并以亚秒级查询性能搜索数据。使用 S3 Vectors,您可以受益于一套专用的 API 来存储、访问和查询向量,无需预置任何基础设施。它非常适合需要大规模构建和维护向量索引的应用程序,让您能够组织和搜索海量信息。
优势
降低上传、存储和查询向量的成本,同时保持亚秒级查询性能。告别昂贵的存储选项,只为实际使用量付费,从而彻底转变存储数百万至数十亿向量的存储成本结构。无需基础设施管理即可高效扩展海量向量,使用向量索引组织数据,无需资源预置即可适应不断变化的工作负载。S3 Vectors 专为向量驱动的人工智能使用案例而设计,提供了性能与效率的务实平衡。
生成细粒度向量嵌入,从包括图像、视频、音频和文本在内的非结构化数据中获得更深入的理解。为向量搜索应用程序进行弹性扩展,以基于语义相似性提高粒度。无论是分析新闻内容、索引体育精彩片段,还是处理医学图像和基因组数据,S3 Vectors 都能以一致的查询性能和灵活的扩展能力支持高吞吐量工作负载。
将 S3 Vectors 用于不需要内存向量数据库高吞吐量性能的大型、长期向量数据。Amazon OpenSearch Service 提供实时应用所需的高 QPS(每秒查询次数)、低延迟向量搜索,而 S3 Vectors 则通过提供成本优化的数据基础来补充这一点,其查询性能针对长期存储和低频数据访问进行了优化。您还可受益于具有强一致性保证的存储架构,确保后续查询始终包含您最近添加的数据。
使用案例
基于语义和相似性精确定位搜索结果
对大量向量数据集执行语义和相似性搜索。媒体机构可以索引数百万小时的视频,即时呈现精彩片段的相关场景,而医疗机构可以存储代表医学图像的数十亿向量嵌入,以识别相似病例并加速诊断。使用 S3 Vectors,您可以用更低的成本释放非结构化数据的语义价值,同时不影响扩展性。
降低检索增强生成(RAG)成本
使用 S3 Vectors 降低 RAG 成本。通过 RAG 应用程序,将您的专有数据集转变为具有上下文感知能力的智能知识库。借助 S3 Vectors 中可扩展、经济高效的向量存储,快速构建和定制生成式人工智能应用程序,并通过 API 和 SDK 将其与您选择的基础模型和知识库解决方案集成。
构建具有扩展和持久记忆的更智能人工智能代理
通过保留更多上下文、使用更丰富的数据进行推理,以及从经济高效的大规模向量存储中构建持久记忆,让您的人工智能代理更加智能。以低成本存储 PB 级向量数据中的每一次交互、文档和洞察,避免代理被强制遗忘有价值的上下文。支持持续学习、历史上下文回溯、模型重训练和微调,持续深化智能代理的推理能力。无论是用于代理记忆还是跨大规模人工智能数据集的相似性搜索,S3 Vectors 都为任意规模的向量存储和检索提供了经济高效的数据基础。
适用于任意规模开发的人工智能就绪型存储
存储并快速访问任意数量的向量数据,快速启动您的人工智能项目。无需基础设施设置,S3 Vectors 让您可以立即让数据发挥作用并开始人工智能开发。它还能够满足复杂人工智能应用程序对存储的严苛要求。无论您是在构建个性化引擎、自然语言处理系统,还是在大型代码库中导航,S3 Vectors 都能提供成本优化的人工智能就绪型存储,并可根据您的需求进行扩展,从原型到生产,加速人工智能创新的每一步。