首页  云计算知识 
UTF-8

UTF-8 是什么?

二进制的计算机只能用“0”和“1”来代表数据,那么由计算机存储和处理的每个字符(英文字母、阿拉伯数字、汉字,或其他任何字符)具体该如何用这种方式来表示?此时就需要使用某种规则,将每个可能用到的字符都由一系列“0”和“1”组成的字符串来表示,让每个字符都有一个唯一的字符串与之对应。这种规则就是字符编码。UTF-8 就是一种基于 Unicode 字符集的编码方式。

新用户享受中国区域 12个月免费套餐

UTF-8 是什么?
首页  云计算知识 
UTF-8
UTF-8 是什么?

UTF-8 是什么?

二进制的计算机只能用“0”和“1”来代表数据,那么由计算机存储和处理的每个字符(英文字母、阿拉伯数字、汉字,或其他任何字符)具体该如何用这种方式来表示?此时就需要使用某种规则,将每个可能用到的字符都由一系列“0”和“1”组成的字符串来表示,让每个字符都有一个唯一的字符串与之对应。这种规则就是字符编码。UTF-8 就是一种基于 Unicode 字符集的编码方式。

新用户享受中国区域 12个月免费套餐

UTF-8 的优势

UTF-8 的优势

Unicode 是一种适用于全球大部分的文字系统的统一字符编码标准,而 UTF-8 也就对所有语言提供了支持。这在当今全球化的交流中显得更加重要。

在 UTF-8 普及前,各种语言文字使用自己的编码标准,例如简体中文的 GB2312,繁体中文的 BIG5 等。这些标准无法通用,会导致用一种编码方式创建的程序、文件和网页,在使用另一种编码方式的系统或软件中显示为乱码。此时必须手工切换编码(对于网页),甚至使用某些专门的编码转换软件(对于软件)。

随着较新的操作系统和应用程序开始普遍支持 UTF-8,全球大部分文字的内容,都可以使用 UTF-8 以统一、通用的方式对各种字符进行编码,并直接在所有支持 UTF-8 的系统和软件中正确显示。

常见的字符集编码规范

常见的字符集编码规范

常见的字符集编码规范_ASCII

ASCII

共规定了 128 个字符的编码,包含大小写英文字母、阿拉伯数字、常用标点符号等字符。由于支持的字符较少,后来在此基础上还扩展创建了 ISO-8859-1 规范。

常见的字符集编码规范_GB2312

GB2312

针对简体中文字符创建的双字节编码规范,只支持 6763 个常用汉字,后来在此基础上扩展创建了可支持 21003 个汉字的 GBK 规范。随后还进一步扩展出了可支持更多汉字的 GB18030 规范,但随着 UTF-8 的普及,该规范并未得到广泛应用。

常见的字符集编码规范_BIG5

BIG5

针对繁体中文字符创建的双字节编码规范,共包含 13060 个中文字。

常见的字符集编码规范_Unicode

Unicode

一种支持全球所有语言文字的编码规范,共包含 1114112 个编码点,这使得地球上所有字符都可以纳入其中。Unicode 规范至今仍在不断更新,目前最新版为 2021 年 9 月发布的 14.0.0 版,该版本可支持 159 种文字共 144697 个字符。

常见的字符集编码规范_ASCII

ASCII

共规定了 128 个字符的编码,包含大小写英文字母、阿拉伯数字、常用标点符号等字符。由于支持的字符较少,后来在此基础上还扩展创建了 ISO-8859-1 规范。

常见的字符集编码规范_GB2312

GB2312

针对简体中文字符创建的双字节编码规范,只支持 6763 个常用汉字,后来在此基础上扩展创建了可支持 21003 个汉字的 GBK 规范。随后还进一步扩展出了可支持更多汉字的 GB18030 规范,但随着 UTF-8 的普及,该规范并未得到广泛应用。

常见的字符集编码规范_BIG5

BIG5

针对繁体中文字符创建的双字节编码规范,共包含 13060 个中文字。

常见的字符集编码规范_Unicode

Unicode

一种支持全球所有语言文字的编码规范,共包含 1114112 个编码点,这使得地球上所有字符都可以纳入其中。Unicode 规范至今仍在不断更新,目前最新版为 2021 年 9 月发布的 14.0.0 版,该版本可支持 159 种文字共 144697 个字符。

了解亚马逊云科技相关资讯

了解亚马逊云科技相关资讯

使用 Jetson nano 结合 Amazon Web Services 机器学习和 IoT 实现边缘智能

Amazon Web Services IoT Greengrass 可将 Amazon Web Services 无缝扩展至边缘设备,因此可以在本地操作其生成的数据,同时仍可将云用于管理、分析和持久存储。借助 Amazon Web Services IoT Greengrass,边缘设备可以运行 Amazon Web Services Lambda 函数、Docker 容器,基于机器学习模型执行预测、使设备数据保持同步以及与其他设备安全通信 – 甚至在没有连接 Internet 的情况下也可实现这些功能。

关系数据库管理工具 —— Amazon RDS for Oracle

Amazon RDS for Oracle 提供多可用区部署方案,可针对特定区域内的数据库实例提供更出色的可用性与持久性,同时带来高效灾难恢复解决方案。当然,一部分运行关键任务数据库的客户希望自己的灾难恢复配置能够跨越多个区域,以满足特殊的业务需求。此外,这些客户还希望利用灾难恢复的投资来处理某些只读生产工作负载。

云技术的综合运用 —— 利用 Amazon Chime 创建一个实时事件解决方案

本文将介绍如何部署交互式实时事件解决方案。通过该解决方案,演讲者可以向大量预选观众进行演示,主持人可以筛选参加广播的与会者。这个使用 Amazon Chime 开发工具包构建的交互式实时事件解决方案能应对传统在线会议平台应用于实时广播事件时的许多不足,包括出席人数限制、访问控制和参与者筛选。

利用 Amazon Organizations 与 Amazon IAM 标记资源

要建立起有意义的成本分配模型,首先需要对各项资源及服务进行标记。标签还能够控制对于 Amazon Web Services 资源的访问,应用于 IAM 用户与角色,并通过 Amazon API 或直接在 Amazon 控制台中定位各类 Amazon 资源。本文将聊聊该如何实施并验证资源标签。

使用 Jetson nano 结合 Amazon Web Services 机器学习和 IoT 实现边缘智能

Amazon Web Services IoT Greengrass 可将 Amazon Web Services 无缝扩展至边缘设备,因此可以在本地操作其生成的数据,同时仍可将云用于管理、分析和持久存储。借助 Amazon Web Services IoT Greengrass,边缘设备可以运行 Amazon Web Services Lambda 函数、Docker 容器,基于机器学习模型执行预测、使设备数据保持同步以及与其他设备安全通信 – 甚至在没有连接 Internet 的情况下也可实现这些功能。

关系数据库管理工具 —— Amazon RDS for Oracle

Amazon RDS for Oracle 提供多可用区部署方案,可针对特定区域内的数据库实例提供更出色的可用性与持久性,同时带来高效灾难恢复解决方案。当然,一部分运行关键任务数据库的客户希望自己的灾难恢复配置能够跨越多个区域,以满足特殊的业务需求。此外,这些客户还希望利用灾难恢复的投资来处理某些只读生产工作负载。

云技术的综合运用 —— 利用 Amazon Chime 创建一个实时事件解决方案

本文将介绍如何部署交互式实时事件解决方案。通过该解决方案,演讲者可以向大量预选观众进行演示,主持人可以筛选参加广播的与会者。这个使用 Amazon Chime 开发工具包构建的交互式实时事件解决方案能应对传统在线会议平台应用于实时广播事件时的许多不足,包括出席人数限制、访问控制和参与者筛选。

利用 Amazon Organizations 与 Amazon IAM 标记资源

要建立起有意义的成本分配模型,首先需要对各项资源及服务进行标记。标签还能够控制对于 Amazon Web Services 资源的访问,应用于 IAM 用户与角色,并通过 Amazon API 或直接在 Amazon 控制台中定位各类 Amazon 资源。本文将聊聊该如何实施并验证资源标签。

亚马逊云科技相关产品

亚马逊云科技相关产品

Amazon Lambda

Amazon Lambda

运行代码,无需顾虑服务器。只需按消耗的计算时间付费。

Amazon S3

Amazon S3

专为可从任何位置检索任意数量的数据而构建的对象存储。

Amazon Aurora

Amazon Aurora

与 MySQL 和 PostgreSQL 兼容的关系数据库,专为云而打造。

Amazon SageMaker

Amazon SageMaker

适用于每位开发人员和数据科学家的机器学习。

准备好免费体验亚马逊云科技相关产品了吗?
准备好免费体验亚马逊云科技相关产品了吗?

新用户注册,可免费体验 12 个月

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多
官方开发资源及培训教程