XML と文字エンコード

XML ドキュメントでは、内部表現に Unicode 文字エンコード規格が使用されます。Unicode では、文字が 16 ビットの項目として表現されます。外部表現に対しては、ほとんどの XML ドキュメントが、標準の Unicode 変換形式である UTF-8 または UTF-16 を使用してエンコードされます。XML 拡張によって作成された XML ドキュメントでは、外部表現用のエンコードに常に UTF-8 が使用されます。UTF-8 は、ほとんどの表示可能文字を 8 ビットで表現する Unicode エンコーディング方式です。0x20 ~ 0x7e の範囲の文字 (通常の表示可能文字セット) は標準の ASCII と区別できません。

XML SET ENCODING 文を使用すると、COBOL データ構造内のデータの文字エンコードを指定できます。これにより、ローカルの文字エンコードと UTF-8 の間で文字エンコードを切り替えることができます。XML SET ENCODING 文は XML ドキュメントの文字エンコードには影響しませんが、COBOL プログラムのデータの文字エンコードには影響することに注意してください。詳細については、「データ表現」を参照してください。