什么是零样本学习_零样本学习有哪些应用场景-亚马逊云科技

Q: 零样本学习的工作原理是什么?

零样本学习通过辅助信息将观察到的类别与未观察到的类别关联起来。例如，一个训练识别马的模型，在了解斑马像条纹马后，也能识别斑马。它通过学习已知类别的参数及其表示，依赖表示相似性在推理时将实例分类到新的未见类别。

Q: 零样本学习有哪些应用场景?

零样本学习广泛应用于多个领域，包括：1) 计算机视觉任务，如图像分类、语义分割和目标检测；2) 自然语言处理任务，如多语种领域、细粒度实体分类、文本蕴含和问答；3) 生成式建模，可以生成训练数据中很少或没有出现过的新样本；4) 大型语言模型，通过提示就能执行各种任务而无需显式训练。

零样本学习的工作原理是什么

通过辅助信息关联已观察和未观察类别

零样本学习方法通常通过某种形式的辅助信息将观察到的类别和未观察到的类别联系起来，这些辅助信息编码了对象的可观察到的区分特性。例如，给定一组待分类的动物图像，以及描述动物外观的文本辅助信息，一个经过训练可以识别马但从未见过斑马的人工智能模型，在了解到斑马看起来像条纹马之后，仍然可以识别斑马。

基于类别表示的相似性

在计算机视觉领域，零样本学习模型学习已观察类别的参数及其类别表示，并依赖于类别标签之间的表示相似性，以便在推理时将实例分类到新类别。在自然语言处理领域，零样本学习关键的技术方向是"理解标签" - 将标签表示在与待分类文档相同的语义空间中，从而支持在不观察任何标注数据的情况下对单个示例进行分类。

处理泛化零样本学习的挑战

对于泛化零样本学习的挑战，其中在测试时可能出现来自新类别和已知类别的样本，一些处理方法包括使用门控模块来决定样本是来自新类别还是已知类别，或使用生成模块生成未观察到类别的特征表示。

通过丰富的表示实现泛化

大型语言模型（LLM）可以通过零样本学习响应广泛的请求，而无需显式训练，通常通过提示实现，尽管答案的准确性可能有所不同。在零样本学习中，基础LLM可以执行在训练期间看到很少或没有示例的任务或生成数据。这是通过模型学习丰富的表示来实现良好泛化的。例如，一个训练有素的生成动物图像的模型可以通过理解和组合它所看到的其他动物的特征，使用零样本学习来生成罕见动物的图像。

零样本学习有哪些优势

零样本学习能够为机器学习系统带来诸多优势。以下是零样本学习的主要优点：

无需训练数据即可识别新类别

零样本学习的一大优势在于，它能够对从未在训练数据中出现过的新类别进行识别和分类。这在现实世界中很有价值，因为新的类别会不断出现，而重新训练整个模型是一项昂贵的工作。零样本学习使得系统能够灵活地适应新类别，而无需重新训练。

广泛适用于多个领域

零样本学习技术可以广泛应用于计算机视觉、自然语言处理、计算生物学等多个领域。无论是识别新物体、理解新概念还是分析新基因序列，零样本学习都能发挥作用。这种通用性使得零样本学习成为一种强大的工具，能够解决各个领域中的分类问题。

利用辅助信息进行分类

零样本学习可以利用关于类别的辅助信息，如文本描述或基于属性的表示，来进行分类，而无需任何训练样本。这种方法避免了获取大量标注数据的高昂成本，使得零样本学习在数据稀缺的情况下也能发挥作用。

支持广义零样本学习

零样本学习还可以扩展到广义零样本学习设置，在测试时同时处理新类别和已知类别。这种灵活性使得零样本学习在实际应用中更加实用，能够满足复杂的分类需求。

零样本学习的类型有哪些

基于属性的零样本学习

类别由预定义的结构化描述表示，如"红头"和"长喙"表示鸟类。主要应用于计算机视觉，也有一些自然语言处理的例子。

基于文本描述的零样本学习

这是自然语言处理中的主要方向，类别标签与待分类文档在同一语义空间中表示，通常使用定义或维基百科等自由文本描述。

基于类别相似性的零样本学习

类别被嵌入到连续空间中，零样本分类器可以预测样本在该空间中的位置，从而确定最近的类别，即使在训练时没有观察到该类别的样本。

广义零样本学习

测试时既可能出现新类别也可能出现已知类别，带来额外挑战。处理方法包括使用门控模块判断样本是来自新类别还是已知类别，或使用生成模块生成未见类别的特征表示。

如何使用零样本学习

零样本学习是一种深度学习问题设置，其中学习者观察到来自训练期间未见过的类别的样本，并需要预测它们所属的类别。本质上，零样本学习可视为一种极端情况下的领域适应问题，在训练期间目标类别没有任何样本可用。

基于表示相似性的分类

零样本学习方法通常通过辅助信息将观察到的类别与未观察到的类别关联起来，从而对新类别进行分类。这些辅助信息编码了对象的区分特性。例如，如果一个模型被训练用于识别马，但知道斑马看起来像有条纹的马，那么它也能识别斑马。在计算机视觉领域，零样本学习模型学习已知类别的参数及其类别表示，并依赖表示相似性在推理期间将实例分类到新的未见类别。在自然语言处理中，关键方法是将类别标签表示在与待分类文档相同的语义空间中，从而实现对单个示例的分类而无需任何标注数据。

泛化零样本学习

泛化零样本学习提出了额外的挑战，因为在测试时既可能出现新类别，也可能出现已知类别。解决方法包括使用门控模块来决定样本是来自新类别还是已知类别，或使用生成模块来产生未见类别的特征表示。

零样本学习在生成模型中的应用

零样本学习使大型语言模型能够响应广泛的请求，而无需显式训练，通常通过提示实现。这些模型在大型数据集上进行训练，可直接使用或针对特定任务使用公司特定数据进行定制，而无需对大量数据进行标注。

零样本学习有哪些应用场景

零样本学习是一种机器学习范式，能够让模型在没有任何标注数据的情况下，对新类别或任务进行推理和生成。它在多个领域都有广泛的应用场景，包括：

计算机视觉任务

零样本学习在图像分类、语义分割、目标检测等计算机视觉任务中发挥着重要作用。模型通过学习已知类别的表示，利用类别之间的语义相似性，对新类别进行推理和分类。这种方法避免了对新类别进行大量标注的需求。

自然语言处理任务

在自然语言处理领域，零样本学习的关键技术是将类别标签和文本映射到同一语义空间中。这样即使没有标注数据，模型也能根据语义相似性对新类别进行分类。这种方法已被扩展到多语种领域、细粒度实体分类、文本蕴含和问答等任务中。

生成式建模

零样本学习使生成模型能够生成训练数据中很少或没有出现过的新样本。通过学习丰富的表示，模型可以很好地泛化，将已学习的特征组合起来生成新类别的数据。比如一个训练于动物图像的生成模型，就能通过零样本学习生成罕见动物的图像。

大型语言模型

一些大型语言模型如GPT-1已展现出通过提示就能执行各种任务的能力，而无需显式训练。这种广泛的泛化能力正是零样本学习的体现。尽管准确性有待提高，但这种范式为未来的人工智能系统带来了新的可能性。

零样本学习与传统机器学习的区别是什么

训练数据需求不同

传统机器学习模型需要大量标注好的训练数据，才能对已知类别进行分类和预测。而零样本学习模型则无需针对所有类别的样本进行训练，它可以通过学习丰富的特征表示，利用已知类别的特征组合来推理和识别未知类别的样本。因此，零样本学习在训练数据需求上更加灵活。

泛化能力不同

传统机器学习模型的泛化能力受限于训练数据的覆盖范围，无法推广到训练数据之外的情况。零样本学习模型则通过学习丰富的特征表示，提高了模型的泛化能力，可以更好地适应新的、未见过的情况，具有更强的适应性和灵活性。

适用场景不同

传统机器学习模型只能对训练过程中出现过的类别进行预测，无法泛化到全新的未知类别。而零样本学习模型则可以利用类别之间的关联信息（如文本描述或结构化属性表示），从而对未在训练数据中出现的新类别进行识别和分类，适用于极端领域迁移的场景。

模型学习方式不同

传统机器学习模型通过从大量标注数据中学习特征模式来进行分类和预测。而零样本学习模型则需要学习更加丰富和抽象的特征表示，并通过组合和推理这些特征来处理新的未知情况，其学习方式更加复杂。

零样本学习面临的挑战有哪些

新旧类别识别困难

零样本学习在测试时很难判断给定样本是来自新类别还是已知类别，需要特殊的门控模块进行判断。

特征表示生成挑战

一些方法需要生成未见类别的特征表示，以便将其与已见类别一同训练分类器，这对特征生成模块提出了挑战。

需要辅助信息

零样本学习需要关于未见类别的辅助信息，如结构化描述、自然语言定义等，以表征未见类别。

连续空间嵌入困难

将类别嵌入到连续空间，并基于最近邻类别进行预测，也给嵌入方法带来了挑战。

零样本学习的发展历程是什么

零样本学习是一种机器学习范式，其发展历程可以概括为以下几个阶段：

零样本学习的起源

零样本学习的概念最早出现在2008年，当时在自然语言处理和计算机视觉领域分别发表了第一批相关论文。尽管当时还没有使用"零样本学习"这一术语，自然语言处理论文称之为"无数据分类"，而计算机视觉论文则称之为"零数据学习"。

术语"零样本学习"的确立

直到2009年，在NIPS'09会议上，Palatucci、Hinton、Pomerleau和Mitchell的一篇论文首次使用了"零样本学习"这一术语。此后，这一术语在计算机视觉领域得到了广泛采用，成为这一学习范式的通用名称。

零样本学习的拓展

随着时间的推移，零样本学习方法被拓展到了计算机视觉和自然语言处理之外的其他领域，如计算生物学等。研究人员还探索了广义零样本学习，其中在测试时既可能出现已知类别，也可能出现未知类别，需要新的技术来应对这一挑战。

亚马逊云科技热门云产品

Amazon Transcribe

自动语音识别

Amazon Glue

准备和加载数据

Amazon MQ

使用多个来源的正确数据为您的应用程序提供大规模支持

Amazon Cognito

应用程序的身份管理

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务，获取更多官方开发资源及培训教程

快速上手训练营
账单设置与查看
动手实操

快速上手训练营
第一课：亚马逊云科技简介

本课程帮助您初步了解云平台与本地环境的差异，以及亚马逊云科技平台的基础设施和部分核心服务，包括亚马逊云科技平台上的弹性高可用架构，架构设计准则和本地架构迁移上云的基本知识。

亚马逊云科技技术讲师：李锦鸿

了解更多 »

了解更多入门学习计划 »

第二课：存储与数据库服务

您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。

亚马逊云科技资深技术讲师：周一川

了解更多 »

第三课：安全、身份和访问管理

在这个模块，您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识，责任共担模型以及身份和访问管理服务， Identity and Access Management (IAM) 。同时，通过讲师演示，您将学会如何授权给 EC2 实例，允许其访问 S3 上的资源。

亚马逊云科技技术讲师：马仲凯

了解更多 »

了解更多入门学习计划 »
账单设置与查看
视频：快速完成税务设置

部署时间：5 分钟

开始教程 »

了解更多入门学习计划 »

视频：账户账单信息

部署时间：3 分钟

开始教程 »

视频：如何支付账单

部署时间：3 分钟

开始教程 »

了解更多入门学习计划 »
动手实操
快速上手云上无服务器化的 MySQL 数据库

本教程将引导您创建一个Aurora Serverless 数据库并且连接上它。

部署时间：10 分钟

开始教程 »

查看更多教程 »

启动一台基于 Graviton2 的 EC2 实例

本教程将为您讲解如何在云控制台上启动一台基于 Graviton2 的 EC2 实例。

部署时间：5 分钟

开始教程 »

使用 Amazon Systems Manager 进行云资源统一跟踪和管理

在这个快速上手教程中，您将学会如何使用 Amazon Systems Manager 在 Amazon EC2 实例上远程运行命令。

部署时间：10 分钟

开始教程 »

查看更多教程 »