发布于: Apr 21, 2020

Amazon Elasticsearch Service 现在支持向您的域添加自定义字典文件。现在,您可以通过指定同义词、停止词和分词文件来改进索引、匹配和搜索的相关性。以前,您只能在映射中直接包含这些类型的自定义项,而这可能导致它们十分笨拙和难以管理。 

同义词通过类似的概念扩大了匹配范围。例如,您可以指定同义词“one-> 1”来匹配包含这些相关概念的任何查询。停止词是常见的低价值词语,例如 “a、a 和 the”,这些词语对匹配或相关性没有积极贡献。这些词将从索引和查询中移除。使用自定义分词字典对于优化亚洲语言和德语自由文本的索引尤其重要。这些语言使用复合字词,不同的上下文和分割方式可能意味着不同的事物。您可以使用分词字典来严格控制其分解方式。 

借助对自定义字典的支持,Amazon Elasticsearch Service 现在可以从 Amazon S3 导入您的字典文件,并根据需要将它们与您的 Amazon Elasticsearch Service 域关联起来。自定义字典支持适用于 Amazon Elasticsearch Service 上所有版本的 Elasticsearch。要了解更多信息,请参阅文档。 

Amazon Elasticsearch Service 现已在全球 21 个区域开放自定义字典支持:美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈、加利福尼亚北部)、Amazon GovCloud(US-Gov-East、US-Gov-West)、加拿大(中部)、南美洲(圣保罗)、欧洲(爱尔兰、伦敦、法兰克福、巴黎、斯德哥尔摩)、亚太地区(新加坡、悉尼、东京、首尔、孟买、香港)、由光环新网运营的中国(北京)区域和由西云数据运营的中国(宁夏)区域。有关 Amazon Elasticsearch Service 可用性的更多信息,请参阅  亚马逊云科技区域表。