用語集
Unicodeゆにこーど
世界中の文字を統一的に扱う文字符号化規格。UTF-8 等の符号化方式を持つ。
ITパスポート
Unicode は、世界中の言語の文字を統一的に扱うことを目的とした文字符号化規格です。約 15 万文字以上を登録済みで、絵文字も含みます。
| 実装方式 | バイト数 | 特徴 |
|---|---|---|
| UTF-8 | 1〜4 バイト(可変長) | ASCII 互換・Web で標準 |
| UTF-16 | 2 または 4 バイト | Windows 等で使用 |
| UTF-32 | 4 バイト固定 | 単純だが容量大 |
ASCII が英数字しか扱えなかったのに対し、Unicode は多言語を 1 つの規格で統一的に表せます。Web では UTF-8 が事実上の標準です。日本語処理では Shift_JIS との変換で文字化けが起きることもあります。
試験では 「世界中の文字を統一的に扱う規格」である点と、実装方式の UTF-8 との関係が問われます。