charmap - ファイルのフォーマットと規約の説明 - Linux コマンド集 一覧表
名前
charmap - 文字符号化を定義するための文字シンボル
書式
文字集合記述 (charmap) は使用できる文字集合とその符号化を定義する。 サポートされる全ての文字集合は妥当なサブセットとして "共通文字集合 (portable character set)" を持たなければならない。
文法
charmap ファイルは以下のキーワードからなるヘッダーで始まる:
- <codeset>
- はコードセットの名前を指定する。
- <mb_cur_max>
- は複数バイト文字の一文字あたりの最大バイト数を指定する。 複数バイト文字は現在のところサポートされていない。デフォルトは 1 である。
- <mb_cur_min>
- は一文字あたりの最低バイト数を指定する。この値は mb_cur_max 以下でなければならない。 もし指定されなければデフォルトは mb_cur_max と同じである。
- <escape_char>
- ファイルの残りの部分でエスケープ・キャラクターとして使用する文字 を指定する。これで特殊な意味に解釈される文字をエスケープする。 デフォルトはバックスラッシュ ( \ )である。
- <comment_char>
-
はファイルの残りの部分でコメント・キャラクターとして使用する文字
を指定する。デフォルトではシャープ
(
#
)である。
charmap の定義そのものは第一カラムにキーワード CHARMAP を置くことで始める。
以下の行は文字の符号化を定義するための二つの方法である: - <symbolic-name> <encoding> <comments>
-
これは一つの文字とその符号化を定義する。
- <symbolic-name>...<symbolic-name> <encoding> <comments>
-
この形式は複数の文字を定義する。これは複数バイト文字 (現在は実装されていない)
のみで有用である。
charmap の定義の最後の行は END CHARMAP を置く。
シンボル名
文字の シンボル名 (symbolic name) は 共通文字集合(portable character set) の文字のみを含んでいる。 この名前はかぎかっこ < > で挟む。 <escape_char> に続く文字はそれ自身として解釈される。例えば '<\\\>>' のような文字列は '\>' というシンボル名をかぎかっこで狭んで表現している。
文字符号化
符号化は以下の三つの形式のどれかで表す:
- <escape_char>d<数字>
- は 10 進の数値を表す。
- <escape_char>x<数字>
- は 16 進の数値を表す。
- <escape_char><数字>
- は 8 進の数値を表す。
ファイル
/usr/share/i18n/charmaps/*
著者
Jochen Hein (jochen.hein@delphi.central.de)
準拠
POSIX.2
関連項目
locale
(1),
localedef
(1),
localeconv
(3),
setlocale
(3),
locale
(5)