Unicode のサポート

Unicode は、大部分の言語を表すために使用できる文字エンコーディング方式の集合につけられた一般的な名称です。Unicode で定義されている主なエンコーディング方式として、UTF-8、UTF-16 および UTF-32 (UTF は Unicode Transformation Format の略称です) があります。

ご使用の COBOL 開発システムでは、各国語の文字を表すために UTF-16 を使用します。UTF-16 では、各国文字はそれぞれメモリの 2 バイトを使用し、65536 通りの文字の組み合わせが可能です。

UTF-8 エンコーディングスキームは、可変幅の Unicode エンコーディングです。有効な各 Unicode コードポイントは、1 から 4 個の 8 ビットバイトを使用してエンコードされます。UTF-8 は、(ASCII との) 下位互換性があるため、一般的なエンコーディングスキームです。エンディアンに依存せず、多くの場合は UTF-16 と比較して簡潔な Unicode 表現を提供します。

COBOL アプリケーションは、単一のアプリケーションで複数の各国語からのアプリケーションデータを管理するために、Unicode を使用する傾向が強くなってきています。COBOL 言語による Unicode のサポートは、ISO2002 COBOL 規格に準拠します。各国文字データは標準の COBOL ファイルまたは SQL データベースに格納できます。また、Unicode サポートを使用して、COBOL と Java 間で各国文字列を直接受け渡すことができます。DBCS 環境では、Unicode サポートを既存の DBCS サポートと並行して使用し、必要に応じて既存の DBCS アプリケーションを Unicode へ徐々に移行することもできます。