- 首页›
- 亚马逊云科技文档概述›
- Amazon Athena 文档
Amazon Athena 文档
Amazon Athena 是一种交互式查询服务,旨在使用标准 SQL 语言在 Amazon S3 中直接分析数据。客户可以将 Athena 指向其存储在 S3 中的数据,并开始使用标准 SQL 运行临时查询并获取结果。Athena 属于无服务器服务,因此无需设置或管理基础设施。您可以使用 Athena 处理日志、执行临时分析及运行交互式查询。Athena 可自动扩展以并行执行查询,因此,即使对于大型数据集和复杂的查询,也能快速获得结果。
无服务器
Amazon Athena 属于无服务器服务,因此无需管理基础设施。您无需担心配置、软件更新、故障或随着您的数据集和用户人数增加而扩展基础设施。Athena 会为您自动处理所有这些工作,以便您可以专注于数据,而非基础设施。
轻松入门
要开始使用,请登录 Athena 控制台,使用控制台向导或输入 DDL 语句来定义您的模式,然后使用内置的查询编辑器开始查询。您还可以使用 Amazon Glue 抓取数据源以发现数据,并在 Data Catalog 中填充新表格和修改的表格及分区定义。结果会立即显示在控制台中,并且会自动写入您在 S3 中选择的位置。您也可以将它们下载到您的桌面。使用 Athena,无需进行复杂的 ETL 作业即可将您的数据准备好用于分析。
易于查询,只需使用标准 SQL
Amazon Athena 使用 Presto,这是一种针对低延迟、临时数据分析进行优化的开源分布式 SQL 查询引擎。这意味着,您可以使用 ANSI SQL 对 Amazon S3 中存储的大型数据集运行查询,并完全支持大型联接、开窗函数和数组。Athena 支持各种不同的数据格式,如 CSV、JSON、ORC、Avro 或 Parquet。您也可以使用 Athena 的 JDBC 驱动程序从各种不同的 BI 工具连接到 Athena。
性能
使用 Amazon Athena,您不必担心需要管理或调整集群才能提升性能。Athena 专为优化 Amazon S3 的性能而设计。Athena 可以自动并行执行查询,因此即使对于大型数据集,您也能快速获取查询结果。
可用性高且持久性强
Amazon Athena 具有高度可用性,可在多个设施中使用计算资源执行查询,如果某特定设施无法访问,则会自动适当地路由查询。Athena 使用 Amazon S3 作为其底层数据存储,从而使您的数据可用性高、持久性强。您的数据将在多个设施以及一个设施内的多个设备上冗余存储。
安全
Amazon Athena 允许您使用 Amazon Identity and Access Management(IAM)策略、访问控制列表(ACL)和 Amazon S3 存储桶策略控制对您数据的访问。通过 IAM 策略,您可以授予 IAM 用户对 S3 存储桶的细化控制权。通过控制对 S3 中数据的访问,您可以限制用户使用 Athena 查询数据。Athena 还允许您查询 Amazon S3 中存储的加密数据,并将加密的结果写回您的 S3 存储桶中。服务器端加密和客户端加密均受支持。
集成化
Amazon Athena 可与 Amazon Glue 集成。 使用 Glue Data Catalog,您将能够跨各种服务创建统一的元数据存储库,抓取数据源以发现数据并在您的 Data Catalog 中填充新表格和修改的表格以及分区定义,并维持模式版本控制。您还可以使用 Glue 的托管型 ETL 功能变换数据或将数据转换为列式格式,以优化查询性能。
联合查询
借助 Athena,您可以对存储在关系型、非关系型、对象存储以及自定义数据源中的数据,统一使用 SQL 语句进行查询。您可以使用熟悉的 SQL 结构来连接多个数据源中的数据来进行快速分析,并将结果存储在 Amazon S3 中供后续使用。Athena 使用在 Amazon Lambda 上运行的 Athena 数据源连接器执行联合查询。亚马逊云科技拥有开源数据源连接器,适用于 Amazon DynamoDB、Apache HBase、Amazon Document DB、Amazon Redshift、Amazon CloudWatch、Amazon CloudWatch Metrics 以及 MySQL 和 PostgreSQL 等兼容 JDBC 的关系数据库。您可以使用这些连接器在 Athena 中运行联合 SQL 查询。此外,使用 Athena Query Federation SDK,您可以构建至其他数据源的连接器。
机器学习
您可以在 Athena SQL 查询中调用您的 SageMaker 机器学习模型,以运行推理。由于能够在 SQL 查询中使用机器学习模型,异常检测、客户群体分析和销售预测等复杂任务变得像编写 SQL 查询一样简单。Athena 可以帮助任何具备 SQL 经验的人运行 Amazon SageMaker 中部署的机器学习模型。
其他信息
有关服务控制、安全特性及功能的其他信息,包括有关存储、检索、修改、限制和删除数据的信息,请参见 https://docs.amazonaws.cn/。以上链接包含的信息不构成光环新网关于亚马逊云科技(北京区域)的客户协议或西云数据关于亚马逊云科技(宁夏区域)的客户协议的 “文档”的一部分,也不构成您与光环新网或西云数据之间就您使用亚马逊云科技中国区域服务达成的其他协议的任何部分。