跳至主要内容

适用于 Amazon ElastiCache 的向量搜索现已在亚马逊云科技中国区域中推出

发布于: 2025年10月14日

即日起,Amazon ElastiCache 用于 Valkey 的向量搜索已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域正式推出。客户现在可以使用 ElastiCache 对来自 Amazon SageMaker 等知名提供商的数十亿个高维向量嵌入进行索引、搜索和更新,而且延迟低至微秒,召回率高达 99%。

主要使用案例包括大型语言模型(LLM)和多回合对话代理的语义缓存,它们通过缓存语义相似的查询来显著减少延迟和降低成本。适用于 ElastiCache 的向量搜索还通过检索增强生成(RAG)为代理式人工智能系统提供支持,从而确保在多个检索步骤中获得高度相关的结果和持续的低延迟。其他使用案例包括推荐引擎、异常检测和其他需要跨多种数据模式进行有效搜索的应用场景。

Valkey 版本 8.2 可在基于节点的集群上免费使用适用于 ElastiCache 的向量搜索。要开始使用,可以通过亚马逊云科技管理控制台、亚马逊命令行界面或亚马逊软件开发工具包创建 Valkey 8.2 集群。您还可以在现有集群上使用向量搜索,只需点击几下即可从任何版本的 Valkey 或 Redis OSS 升级到 Valkey 8.2,无需停机。要详细了解如何将适用于 ElastiCache 的向量搜索用于 Valkey,请阅读此博客,有关支持的命令列表,请参阅 ElastiCache 文档