データ表現

COBOL 数値データ項目は、XML では数値文字列として表現されます。負の値の場合は、先頭に負符号が付加されます。先行ゼロ (小数点の左側にあるゼロ) は削除されます。後続ゼロ (小数点の右側にあるゼロ) も同様に削除されます。値が整数の場合、小数点はありません。

COBOL 文字データ項目はテキスト文字列として表現され、後続空白文字 (または、JUSTIFIED 指定を使用して項目が記述されている場合は先行空白文字) は削除されます。ただし、編集データ項目では、先行空白文字および後続空白文字は維持されることに注意してください。また、埋め込み XML 特殊文字はエスケープ シーケンスによって表現されます。アンパサンド (&)、小なり (<)、大なり (>)、引用符 (")、アポストロフィ (') 文字は、そのような XML 特殊文字の例です。

注: 詳細については、「XML での空白文字の処理」を参照してください。

Windows プラットフォームでは、表示可能な文字データは、通常、Microsoft の OEM または ANSI データ形式を使用してエンコードされます。出力時、これらのデータは標準の Unicode 8 ビット変換形式 UTF-8 に変換されます。入力時、データは OEM または ANSI データ形式に変換されます。XML SET ENCODING 文を使用して「UTF-8」が指定されている場合、内部データ形式は UTF-8 になります。詳細については、「Windows の文字エンコード」の説明を参照してください。

UNIX プラットフォームでは、表示可能な文字データは、通常、UNIX システムで使用されるローカルの文字エンコードを使用してエンコードされます。一般的には、これは Latin-1 や Latin-9 になります。出力時、これらのデータは標準の Unicode 8 ビット変換形式 UTF-8 に変換されます。入力時、データはシステムの内部形式に変換されます。XML SET ENCODING 文を使用して「UTF-8」が指定されている場合、内部データ形式は UTF-8 になります。適切なローカルの文字エンコードの選択に関する詳細については、「UNIX の文字エンコード」の説明を参照してください。