kazmax - Linux で自宅サーバー

charmap - ファイルのフォーマットと規約の説明 - Linux コマンド集 一覧表

  1. 名前
  2. 書式
  3. 文法
  4. シンボル名
  5. 文字符号化
  6. ファイル
  7. 著者
  8. 準拠
  9. 関連項目

名前

charmap - 文字符号化を定義するための文字シンボル

書式

文字集合記述 (charmap) は使用できる文字集合とその符号化を定義する。 サポートされる全ての文字集合は妥当なサブセットとして "共通文字集合 (portable character set)" を持たなければならない。

文法

charmap ファイルは以下のキーワードからなるヘッダーで始まる:

<codeset>
はコードセットの名前を指定する。
<mb_cur_max>
は複数バイト文字の一文字あたりの最大バイト数を指定する。 複数バイト文字は現在のところサポートされていない。デフォルトは 1 である。
<mb_cur_min>
は一文字あたりの最低バイト数を指定する。この値は mb_cur_max 以下でなければならない。 もし指定されなければデフォルトは mb_cur_max と同じである。
<escape_char>
ファイルの残りの部分でエスケープ・キャラクターとして使用する文字 を指定する。これで特殊な意味に解釈される文字をエスケープする。 デフォルトはバックスラッシュ ( \ )である。
<comment_char>
はファイルの残りの部分でコメント・キャラクターとして使用する文字 を指定する。デフォルトではシャープ ( # )である。

charmap の定義そのものは第一カラムにキーワード CHARMAP を置くことで始める。
以下の行は文字の符号化を定義するための二つの方法である:

<symbolic-name> <encoding> <comments>
これは一つの文字とその符号化を定義する。
<symbolic-name>...<symbolic-name> <encoding> <comments>
この形式は複数の文字を定義する。これは複数バイト文字 (現在は実装されていない) のみで有用である。

charmap の定義の最後の行は END CHARMAP を置く。

シンボル名

文字の シンボル名 (symbolic name)共通文字集合(portable character set) の文字のみを含んでいる。 この名前はかぎかっこ < > で挟む。 <escape_char> に続く文字はそれ自身として解釈される。例えば '<\\\>>' のような文字列は '\>' というシンボル名をかぎかっこで狭んで表現している。

文字符号化

符号化は以下の三つの形式のどれかで表す:

<escape_char>d<数字>
は 10 進の数値を表す。
<escape_char>x<数字>
は 16 進の数値を表す。
<escape_char><数字>
は 8 進の数値を表す。

ファイル

/usr/share/i18n/charmaps/*

著者

Jochen Hein (jochen.hein@delphi.central.de)

準拠

POSIX.2

関連項目

locale (1), localedef (1),  localeconv (3),   setlocale (3),   locale (5)