Dl - Japanese : D-2.6

構文要素

フィールド名

定数

変数と静的変数

特殊変数

括弧

エンドトークン

フィールド名

形式

予約語FIELDに続く1語がフィールド名トークンである。たとえば：

FIELD a

は，フィールド名"a"のトークンである。同様に，

FIELD FIELD

はフィールド名"FIELD"のトークンである。この場合，2番目のワードFIELDは予約語ではなくフィールド名であり，最初のワードFIELDが予約語である。

予約語FIELDの省略

特殊な場合として，プログラムの先頭あるいは次のトークンの次にある1ワードで，予約語でないものは，フィールド名トークンと解釈する。

(
; , && || !
IF THEN ELIF ELSE WHILE DO
ABS AND ATAN AVG CAPS CAT COS COUNT EXISTS EXP INT LENGTH LOG LOG10 MAX MIN NOT OR SIN SQRT SUM TAN TOLOWER TOUPPER

次の例で，2番目のワード"a"は，トークンEXISTSの次にあるため フィールド名トークンと解釈される。

EXISTS a

フィールド名トークンの評価

フィールド名トークンを評価すると，カレントレコードでそのフィールド名を持つフィールドの値となる。同じフィールド名のフィールドが2つ以上あると，値は配列となる。カレントレコードにその名前のフィールドがないと値は空値となる。

数値限定子

フィールド名トークンの値は文字列である。しかし，たとえば比較演算をする場合数値として扱いたい場合もあるだろう。数値限定子をつけることにより フィールド名トークンを評価した結果を数値として取り出せる。フィールド名の後ろにCOLON（:）と文字"n"をつけると数値限定子となる。たとえば：

FIELD seq

は文字列として評価されるので"10"は"9"より小さくなる。しかし，

FIELD seq:n

は数値として評価されるため，"10"は"9"より大きくなる。

定数

形式

定数の形式には2通りある。 1つは予約語CONSTを使用する。予約語CONSTに続く1語が定数トークンとなる。配列値を表すには，最初の定数に続いてCONST と値とを繰り返す。

CONST a
CONST a CONST b

もう一つの方法は文字BRACEを使う。 LEFT BRACE（{）1文字のワードの後ろで RIGHT BRACE（}）1文字のワードの前にあるワードは全体で定数トークンをなす。このBRACEの中ではDlの予約語は，その意味を失って，定数値となる。

{ a }
{ a b }

このBRACEの中ではLEFT BRACEも単に定数となる。次の例：

{ { } }

は，4番目の語でシンタクスエラーとなる。 3番目の語で定数トークンが終わっているためである。

BRACEによる定数記法では，RIGHT BRACEの1文字だけからなる定数を表記することはできない。次のようにCONSTによる記法を使用すること。

CONST }

空値を表記するには，次のように書く。

{ }

CONSTによる記法では空値を表記する方法はない。

予約語CONSTの省略

特殊な場合として，次のトークンに続く1ワードで，予約語でないものは定数トークンとして解釈する。

!= !~ % * ** + - . .. /
< <= <> = == =~ > >= [
BY DIVEDBY EQ GE GREP GT IN INCL JOIN
LE LIKE LT MINUS MOD NE NUM PLUS POWER
QX S SG SPLIT STR SUBST SUBSTG SUBSTR TIMES UNLIKE

たとえば，

FIELD 1 == 1

この例では，2番目のワード"1"はフィールド名で4番目のワードは定数である。

定数の評価

定数は，そのままで文字列値となる。たとえば演算子"+"の前後のように数値が必要な場合， Dlインタプリタはオペランドを自動的に変換する。定数を直接数値として評価する方法はない。ただし，NUM演算子により変換することができる。

変数と静的変数

形式

変数トークンは予約語VARとそれに続く1ワードからなる。同様に，静的変数トークンは予約語STATICとそれに続く1ワードからなる。 FORトークンの直後に限り予約語VARを省略することができる。予約語STATICを省略することはできない。

変数の寿命

変数および静的変数は，値を保持することができる。この2つの異なりは，その寿命にある。変数の寿命は，プログラムの1実行サイクルで，新しいレコードが入力ファイルから読み込まれて，プログラムを実行する前に変数はすべて初期化される。これに対し静的変数は，Dコマンドの実行期間である。この意味で静的変数が，一般的な「変数」に近く，変数は，ループのインデクスなどのローカルなものである。（FOR演算子は，変数をインデクスとして使う。）

変数および静的変数のスコープは常にプログラム全体である。

変数の評価

変数または静的変数を評価すると，そこに最後に代入された値となる。値を1度も代入していない変数または静的変数 を評価すると空値（要素数0の配列）となる。

特殊変数

構文的には特殊変数は予約語1語からなる。意味的には，いくつかはperlの予約変数のようであり，いくつかはプログラミング言語の文に対応する。

特殊変数を評価すると，プログラムの実行環境に関する値を返したり，プログラムのある機能を実行したりする。この意味で「特殊変数」という名は誤解を生みやすいものもある。しかし，構文上の単純さを確保するためこれらはすべて 特殊変数トークンのもとにまとめられている。

これらの変数は，FIELDSをのぞけば値を代入できない。 FIELDSは，カレントレコード全体を表し，代入演算によって値を変えることもできる。

個別の特殊変数に関しては，演算子および関連特殊変数の節に記述する。

括弧

LEFT PARENTHESIS (()およびRIGHT PARENTHESIS ()) は，通常のプログラミング言語と同様に，演算の順序を変えるために用いる。

ちなみに，CURLEY BRACKETS ({ })は，定数を示して，式のグルーピングには関係しない。また，SQUARE BRACKETS ([ ])は，添え字演算である。

エンドトークン

ワード"--"は，明示的にプログラムの終わりを示すのに使われる。通常，このトークンを使う必要はない。 Dlのパーザは，トークンとして認識できないワードが出てくると自動的にエンドトークンを挿入するためである。 エンドトークンを必要とするのは，入力ファイル名（の最初のもの）がDlの予約語と一致する場合だけである。たとえば：

COUNT a LT 2 -- LT

この例で，3番目の引数LTは，Dlの予約語で，比較演算子"less than"である。これに対し6番目の引数LTは，入力ファイル名である。この場合，エンドトークンが必須となる。これがないと，ファイル名が演算子と解釈されてシンタクスエラーをおこす。（もし入力ファイル名が小文字の"lt"であれば エンドトークンは必要ない。）

演算子および関連特殊変数

単項演算子は，右辺をオペランドとする。 2項演算子は，右辺および左辺をオペランドとする。これらのほかの演算子，たとえば添え字演算子やIF演算子は，おのおの独自の構文を持つ。

Dlの演算子のオペランドは，代入演算子の左辺のような若干の例外を除いて，任意の式である。

いくつかの演算子や特殊変数は別形を持つ。たとえば，"!="，"<>"と"NE"は，同じ演算子である。これは，部分的には，">"のようなシェルの特殊文字をさけるためであり，また，awkやperlのようなポピュラーなプログラムで使われている形を使えるようにするためでもある。

制御演算子

制御演算子はUNIXのshと同様の構文としてある。ただし，現在のDlには，caseやbreak，C言語の continueなどはない。（将来実現する可能性はある。） Dlのの演算子として制御演算子も値をもつ。

次の例は推奨できないが，IFも式をなすので，正しいプログラムである。

IF IF v >= 0 THEN v ELSE - FIELD v FI > 3 THEN q = many FI

制御演算子表

;	逐次実行演算子
IF THEN ELIF THEN ELSE FI	条件演算子
WHILE DO DONE	whileループ演算子
FOR IN DO DONE	forループ演算子
EXIT	プログラム終了
EPILOGUE	エピローグモードフラグ

逐次実行演算子

式1 ; 式2

この演算子はC言語のコンマ演算子と同様である。最初に式1を評価し，次いで式2を評価し，式2の値をとる。なお，C言語の;ふうの使い方を許すため式2のない形も許される。逐次実行演算子の優先順位は最低である。

条件演算子

IF 条件1 THEN 式1 [ELIF 条件2 THEN 式2]... [ELSE 式N] FI

機能的にはC言語の"?:"演算子に当たる。最初に条件1を評価してその値のブール値評価がTRUEであれば，式1を評価して，それを結果の値とする。 条件1がFALSEでELIFのあるとき， 条件2を評価してそれがTRUEなら式2を評価して，それを結果の値とする。すべてのIFとELIFの条件がFALSEで，ELSEのあるとき，式Nを評価して，それを結果の値とする。この場合で，ELSEのないとき，最後のIFまたはELIFの条件式の値（したがってFALSEである）が結果の値となる。

Whileループ演算子

WHILE 条件 DO 式 DONE

条件を評価してその値のブール値評価がTRUEであれば，式を実行する。再び，条件を評価するというループが条件がFALSEになるまで続く。 WHILEループ演算の結果は最後の式の値である。最初から条件の値がFALSEであれば， WHILEループ演算の結果は条件の値となる。

Forループ演算子

FOR 変数 IN 値リスト DO 式 DONE

FOR演算子の最初のオペランドは変数でなければならい。静的変数を含め他のいかなる式も許されない。

値リストを評価してから，変数を 値リストの各要素の値に順次セットして，式を実行する。 FORループ演算の結果は最後の式の値である。ただし，値リストが空値の場合，結果も空値とする。

プログラム終了

EXIT

このワードが評価されると，プログラムは直ちに終了する。この特殊変数は値を返さない。

エピローグモードフラグ

EPILOGUE

この特殊変数は，エピローグモードで実行している場合，単純数値1を返す。それ以外の場合は単純数値0を返す。エピローグモードについてはDedを参照。

比較演算子

==	EQ		等値
!=	NE	<>	非等値
>	GT		より大
>=	GE		以上
<	LT		より小
<=	LE		以下
INCL			含む

比較演算子は，左辺と右辺を比較する2項演算子である。結果は単純数値で1または0となる。おのおのTRUEとFALSEに対応する。構文は次のとおり。

式1 演算子 式2

ここで演算子は，上掲の表の演算子のいずれか。たとえば等値演算では，==とEQのいずれを使っても同じ意味である。アルファベット表記の演算子は，シェルの特殊文字を避けるのに有効である。

比較演算子は，両義性を持つ。すなわち，オペランドの型によって，数値あるいは文字列としての比較を行う。左辺または右辺のオペランドのいずれか一方でも数値の場合，数値比較を行う。左辺と右辺の両方が文字列だった場合，文字列比較を行う。たとえば：

CONST 9 '<' CONST 10

は，結果が0（FALSE）となってしまう。定数は，文字列型となるからである。

NUM CONST 9 '<' CONST 10

とすれば，数値として比較される。次の例は，比較演算でよく間違える例である：

seq '<' 10

この場合も，文字列比較されてしまい，通常予期する結果にはならない。数値比較にするには，数値限定子またはNUM演算子を使うこと。

seq:n '<' 10
seq '<' NUM CONST 10

比較についての詳細は，Dintroマニュアルの値の比較参照。

比較演算子の優先順位は，論理演算子より高く，配列連結演算子より低い。

インクルード演算子

スーパーセット INCL サブセット

インクルード演算子は，オペランドを要素の順序なし集合として扱う。 サブセットのどの要素も，スーパーセットのいずれかの要素に等しければ TRUE，そうでなければFALSEとする。比較はオペランドが双方とも文字列型であれば文字列比較，そうでなければオペランドを数値型に変換して数値比較を行う。

たとえば，フィールド"keywords"にいくつかの語が入っているとする，

Dselect keywords INCL database
Dselect keywords INCL { data base }

によって，それぞれ"database"という語を含んでいるか， "data"と"base"をともに含んでいるか，という条件をテストできる。

インクルード演算子の優先順位は，比較演算子と同順位である。

パターンマッチ・置換演算子・マッチ後特殊変数

`=~`	`LIKE`	正規表現マッチ
`!~`	`UNLIKE`	正規表現案マッチ
`SUBST BY`	`S BY`	置換
`SUBSTG BY`	`SG BY`	全置換
`$&`	`MATCH`	マッチした文字列
`$n`	`MATCHn`	マッチした部分文字列
$`	`PREMATCH`	マッチした部分の前の文字列
`$'`	`POSTMATCH`	マッチした部分の後の文字列

パターンマッチ演算子および置換演算子は，正規表現マッチに関連する。 Dの正規表現はUNIXのegrep仕様に基づく。詳細は，Dintroマニュアルの正規表現の節参照。

パターンマッチ演算子

文字列式 =~ パターン

文字列式 LIKE パターン

文字列式 !~ パターン

文字列式 UNLIKE パターン

LIKEは=~の，UNLIKEは!~の別形である。

パターンマッチ演算子は，正規表現マッチングをテストする。 文字列式およびパターンは，文字列として評価され， パターンを正規表現として文字列式に対しテストされる。結果は単純数値1または0となる。

文字列式およびパターンは，どちらも配列であってよい。パターンマッチテストは，文字列式の要素と， パターンの要素のすべての組み合わせについて行われる。 =~（LIKE）演算では，少なくとも1つのパターンの要素が， 文字列式のいずれかの要素にマッチしたとき，結果が1，そうでなければ0となる。 !~（UNLIKE）演算では，少なくとも1つのパターンの要素が， 文字列式のいずれかの要素にマッチしなかったとき，結果が1，そうでなければ0となる。

オペランドがすべて単純値でない限り， !~演算はNOT =~演算とは異なるので注意すること。たとえば，

NOT a !~ '^[0-9]+$'

は，フィールド"a"が整数かどうかテストする。フィールド"a"がリピーティングフィールドのときは，すべての要素が整数かどうかテストすることになる。これに対して

a =~ '^[0-9]+$'

は，フィールド"a"に整数が1つでもあるかどうかをテストする。

上記例ではUNIXシェルのAPOSTROPHE（'）クォーティングを使っている。 WindowsのシェルではAPOSTROPHEのかわりにQUOTATION MARK（"）を使うこと。

パターンマッチ演算子の優先順位は比較演算子と同じで，結合順序は左からである。

置換演算子

ベース文字列 SUBST パターン BY 置換え文字列

ベース文字列 S パターン BY 置換え文字列

ベース文字列 SUBSTG パターン BY 置換え文字列

ベース文字列 SG パターン BY 置換え文字列

SはSUBSTの，SGはSUBSTGの別形である。

置換演算子は，perlやsedの（したがってUNIXのedやexの） s/xx/yy/およびs/xxx/yy/gにあたる機能をもつ。 ベース文字列，パターン， 置換え文字列はすべて文字列として評価する。 パターンは正規表現としてベース文字列とマッチングを行い，マッチしたとき， ベース文字列のマッチした部分を置換え文字列で置き換えたものが結果の文字列となる。 SUBST (S) 演算では， ベース文字列の最初のマッチ部分のみ置き換える。 SUBSTG (SG) 演算では，マッチしたすべての部分を置き換える。マッチしなかった場合，ベース文字列が結果となる。マッチしてもしなくても，結果は新しい文字列として作成され， ベース文字列自体は変化しない。このため，つぎのような使い方でs/xx/yy/にあたることを行う。

FIELD a = FIELD a SUBST xx BY yy

置換え文字列中で，いくつかの文字は特別な意味を持つ。

`&`	マッチした文字列
`\1`	マッチした文字列のうちパターンの1番目の括弧に対応する部分
...	...
`\9`	マッチした文字列のうちパターンの9番目の括弧に対応する部分
`\&`	&
`\\`	\

例：次の式はTRUEである。

CONST 2002/12/24 SUBST ([0-9]+)/([0-9]+)/([0-9]+) BY \2/\3/\1 == 12/24/2002

オペランドはいずれも配列であり得る。この場合，ベース文字列の各要素について， パターンの各要素を順にマッチングし，マッチしたとき，マッチしたパターンに対応する置換え文字列の要素を使って置き換えを行う。結果は，ベース文字列と同じ要素数を持つ。 パターンに対応する置換え文字列の要素がない（置換え文字列の要素数がパターンの要素数より少ない）場合， 置換え文字列として空文字列を使う。

例：次の式はTRUEである。

{ CBI NACSIS NII } SUBST { CBI NACSIS } BY { NACSIS NII } == { NII NII NII }

置換演算子の優先順位は，連結演算子より高く，JOIN，SPLIT， GREP演算子より低い。結合順序は左からである。

マッチ後特殊変数

これらの特殊変数は，perlの$&， $n， $`および$' と，わずかな差異をのぞいて同じである。これらの特殊変数を評価すると，カレントレコードサイクルの最後の成功したパターンマッチに対応したベース文字列の部分列を値として返す。

MATCH，別形$&は，ベース文字列のマッチした部分列である。

MATCHn，別形$n（ただしnは1, 2, 3 .. 9）は，マッチした部分列の内，パターン中のn番目の括弧に対応した部分である。

PREMATCH，別形$`は，ベース文字列のうち，先頭からマッチした部分の1文字前までの文字列である。

POSTMATCH，別形$'は，ベース文字列のうちマッチした部分の1文字後ろから最後までの文字列である。

結果の値は常に単純文字列である。パターンマッチ演算が配列で行われた場合でも，最後にマッチしたパターンとベース文字列の組み合わせが使われる。パターンマッチ演算や置換演算における，パターンマッチの順序はベース文字列優先，すなわち，式1の最初の要素に式2の各要素を順にマッチし，その後に式1の2番目の要素という順である。

カレントサイクル中一度も成功したマッチングがなかった場合，これらの値は空文字列となる。以前の入力レコードにおけるマッチング結果が使われることはない。

SUBSTG演算におけるPREMATCH特殊変数にはやや問題がある。パターンマッチが同じベース文字列の中で繰り返し行われ，マッチする文字列も複数個あり得るためである。SUBSTG演算の後では，複数あるマッチした文字列のうち最後のものが記憶され，PREMATCHは，それまでの置換えの行われたものを参照する。これは，perlの$`とは異なるが，Dlの現在の実装ではそうなっている。

論理演算子

`!`	`NOT`	論理否定（単項）
`&&`	`AND`	論理積
`\|\|`	`OR`	論理和

論理演算子の優先順位は他の演算子より弱いが， ;および =より強い。この中で，ORがもっとも弱く，次がAND，さらにNOT と強くなる。結合順序は右から左である。

論理否定

! 式

NOT 式

NOTは単項演算子で式をブール値評価して結果がTRUEであれば単純数値0， FALSEであれば単純数値1となる。

論理積・論理和

式1 && 式2

式1 AND 式2

式1 || 式2

式1 OR 式2

AND（&&）およびOR（||）は 2項演算子である。 perlのこれらの演算子のように，値は単純数値0や1ではなく，式1または式2の値となる。

AND（&&）は式1をブール値評価して TRUEであれば，式2を評価してその値をとる。 FALSEであれば，式2は評価されず，値は式1となる。

OR（||）はまず式1をブール値として評価し，結果がTRUEであれば式2は評価せずに式1を値とする。 FALSEであれば，式2を評価してその値をとる。

算術演算子

`+`	PLUS	加算
`-`	MINUS	減算，単項マイナス
`*`	TIMES	乗算
`/`	DIVIDEDBY	除算
`%`	`MOD`	剰余
`**`	POWER	べき乗

算術演算子は単項マイナスをのぞき2項演算である。構文は次のとおり。

式1 演算子 式2

- 式

ここに，演算子は，上の表の演算子の一つ。

式1および式2 （または単項マイナスの場合式）は数値として評価する。 %の場合，さらに整数に変換する。

オペランドが両方単純数値の場合，通常の計算が行われる。左辺または右辺が配列の場合， Dlは特別な扱いをする。

1.: 2.の場合を除き，結果は配列で，そのi番目の要素は式1と式2とのi番目の要素同士を演算した結果とする。オペランドの長さが異なるときは，短い方にあわせて切り捨てられる。
2.: オペランドの片方が単純値で，もう片方が配列の場合，結果は配列で，そのi番目の要素は，単純値と，配列オペランドの胃胃番目の要素とを演算した結果とする。

単項マイナス演算子：

- foo

は，次の式と同じである。

CONST 0 - foo

次の例は上記の規則を例示したもので，すべてTRUEとなる。

CONST 1 + CONST 1 == CONST 2
{ 1 2 3 } + { 3 2 1 } == { 4 4 4 }
{ 1 2 3 } * { 4 } == { 4 8 12 }
{ 1 2 3 } * { 4 5 } == { 4 10 }
{ 6 } / { 6 3 2 } == { 1 2 3 }
{ 6 5 } % { 4 3 2 } == { 2 2 }
{ } + { 1 2 3 } == { }
CONST 1 + { } == { }

演算優先順位は通常通りで，

- (unary)
**
* / %
+ -

すべて比較演算子および配列演算子より高く， 2項算術演算子は文字列連結演算子，数学演算子および単項配列演算子より低い。単項マイナス演算子の優先順位は数学演算子と同じである。

数学演算子

ABS	絶対値
SQRT	平方根
EXP	指数関数
LOG	自然対数
LOG10	常用対数
SIN	正弦
COS	余弦
TAN	正接
ATAN	逆正接

数学演算子は単項演算子でその構文は次の通り。

演算子 式

ここに，演算子は上掲の表のひとつ。

ほとんどのプログラミング言語で，これらのものは「関数」で， LOG(x)のような構文を持つ。しかし，Dlでは演算子で括弧はいらない。たとえば：

SQRT a

しかし，括弧を使っても害はない。

SQRT ( a )

式は数値として評価する。式が配列の場合，結果も同じサイズの配列で，そのi番目の要素は式のi番目の要素にその演算を行ったものとする。次の例を見よ。

ABS { -1 0 1 } == { 1 0 1 } ABS { } == { }

これらの演算子の優先順位は算術演算子より高い。

文字列演算子

`.`		文字列連結
`SUBSTR`		部分文字列
`LENGTH`		文字数
`TOLOWER`	小文字化
`TOUPPER`	`CAPS`	大文字化

連結演算子

文字列式1 . 文字列式2

連結演算子は2項演算子である。 文字列式1と文字列式2は文字列として評価する。 文字列式1の後ろに文字列式2を連結したものが結果の値となる。（オペランド自体は変化しない。）オペランドが配列の場合，算術2項演算と同じ規則が適用される。次の例を参照：

CONST 0x . { abc def } == { 0xabc 0xddef } { "￥" "$" } . { 120.5 1.00 } == { "￥120.5" "$1.00" }

連結演算子の優先順位は算術演算子（**）より高く，置換演算子より低い。

部分文字列演算子

ベース文字列 SUBSTR オフセット長さ配列

Perlや他の多くの言語と異なり DlのSUBSTRは，2項演算子である。右辺がオフセットと長さとを与える。

VAR str SUBSTR { 2 3 }

が，perlのsubstr($str, 2, 3)にあたる。

ベース文字列は必要ならば文字列に変換される。 オフセット長さ配列は，必要ならば数値に変換され，その最初の要素が オフセット，2番目の要素が長さをあたえる。演算の結果は，ベース文字列の先頭オフセット文字を除いて長さ文字の部分文字列である。長さが負の場合， ベース文字列の最後尾からそれだけの文字が削られる。たとえば，{ 2 -3 }は，先頭2文字と最後尾3文字が ベース文字列から削除されることを示す。

オフセット長さ配列の最初と2番目以外の要素は，あっても無視される。要素が一つの場合，（オフセットだけの場合）， ベース文字列の最後までとなる。 オフセット長さ配列に要素がない場合，結果はベース文字列そのままとなる。

オフセットと長さがベース文字列からはみ出す場合，範囲内の部分だけとなる。また，完全にベース文字列の外を指定した場合，結果は空文字列である。これらの場合，結果の文字数は長さで指定したものよりも短くなる。

ベース文字列は複数の要素からなってもよい。この場合，結果はベース文字列と同数の要素からなり， ベース文字列の各要素にそれぞれ部分文字列演算を行ったものとなる。

perlや他の多くの言語と異なり， DlのSUBSTRは，代入演算の左辺式になることはない。同様の機能は連結演算子（.）とSUBSTRとで行えるが，文字列置換演算子（SUBSTまたはS）の方がより簡単に書けることが多い。

SUBSTR演算子の優先順位は連結演算子，置換演算子より高く，GREP，JOIN， SPLIT演算子と同順位で， SPRINTF，SSCANF演算子より低い。

文字数演算子

LENGTH 文字列式

LENGTHは単項演算子である。 文字列式は文字列として評価する。結果は数値で，文字列式の文字数を値とする。 文字列式が配列の場合，結果も配列で 文字列式のi番目の要素の文字数が，結果の配列の i番目の要素となる。次の例を参照：

LENGTH { abc defg } == { 3 4 }

LENGTH演算子の優先順位は数学単項演算子と同じである。

大小文字化演算子

TOUPER 文字列式

CAPS 文字列式

TOLOWER 文字列式

TOUPPER（別形CAPS）， TOLOWER演算子は， 文字列式と同じ長さで，文字列式中の小文字が対応する大文字になっている，またはその逆であることをのぞけば，同じ内容の文字列を値とする。オペランド自体は変化しない。オペランドが配列の場合の扱いは， LENGTHや数学単項演算子と同じである。次の例参照。

TOUPPER { Dselect Dgrep Dextract } == { DSELECT DGREP DEXTRACT }

大小文字化演算子の優先順位は数学単項演算子と同じである

変換演算子

`NUM`	数値変換
`STR`	文字列変換
`INT`	整数変換
`SPRINTF`	printfフォーマットによる変換
`SSCANF`	scanfフォーマットによる変換

数値変換演算子

NUM 式

NUM演算子は式を数値に変換する。オペランド自体は変更されない。変換方法の詳細は Dintro マニュアル参照。オペランドが配列の場合の扱いは，数学単項演算子と同じである。優先順位は数学単項演算子と同じである

文字列変換演算子

STR 式

STR演算子は式を文字列に変換する。オペランド自体は変更されない。変換方法の詳細は Dintro マニュアル参照。オペランドが配列の場合の扱いは，数学単項演算子と同じである。優先順位は数学単項演算子と同じである

整数変換演算子

INT 式

INT演算子は式を文字列に変換する。オペランド自体は変更されない。オペランドが配列の場合の扱いは，数学単項演算子と同じである。優先順位は数学単項演算子と同じである

Sprintf変換演算子

式 SPRINTF フォーマット

SPRINTF変換演算子は，式に対しフォーマットを使って， C言語のsprintf関数による変換をおこなう。この変換は，D出力フォーマットのC-format指定と同じである。変換の詳細は，D_fmtマニュアルの Cフォーマットの節を参照。

式およびフォーマットは，文字列として評価される。 SPRINTF変換で，フォーマットについては，最初の要素だけが使用される。 2番目以降の要素があってもよいが，この演算では無視される。式が配列の場合，演算結果は式と同数の要素を持った配列で，式のi番目の要素を変換した文字列が，結果のi番目の要素となる。エラー（たとえば，フォーマット指定の誤り）があると，変換結果は，空値となる。

SPRINTFの優先順位は，数学単項演算子よりは低いが，他のどの二項演算子より高い。

Sscanf変換演算子

式 SSCANF フォーマット

SSCANF変換演算子は，式で与えられた文字列を，フォーマットを使って C言語のsscanf関数により，数値または文字列に変換する。この変換は，D入力フォーマットのC-format指定と同じである。変換の詳細は，D_fmtマニュアルの Cフォーマットの節を参照。

SSCANF演算の結果の値は， フォーマットのフォーマット指定子に応じて数値または文字列になる。フォーマット指定子のtypeが，'s'または's' であると，結果は文字列になる。それ以外のすべてのtypeの場合，結果は数値となる。

式およびフォーマットは，文字列として評価される。 SSCANF変換で，フォーマットについては，最初の要素だけが使用される。 2番目以降の要素があってもよいが，この演算では無視される。式が配列の場合，演算結果は式と同数の要素を持った配列で，式のi番目の要素を変換した文字列が，結果のi番目の要素となる。 フォーマットのアンマッチでsscanf()が読み込まなかった場合，対応する要素が空文字列または数値0となる。処理の途中でエラー（たとえば，フォーマット指定の誤り）があると，変換結果は，空値となる。

SSCANF演算子の優先順位は，数学単項演算子よりは低いが，他のどの二項演算子より高い。

配列演算子

`,`	配列連結
`COUNT`	要素数
`EXISTS`	存在テスト
`MIN`	最小値
`MAX`	最大値
`SUM`	合計
`AVG`	平均値
`CAT`	要素連結
`JOIN`	区切りを伴う配列要素の連結
`GREP`	比較/パターンマッチ演算による配列要素の選択
`SPLIT`	文字列の配列要素への分解
`..`	一連数値の配列

配列連結演算子

配列1 , 配列2

配列連結演算子は，2項演算子である。 配列1の後ろに配列2の要素を並べたものが，結果の値となる。（配列1がフィールドや変数でもそれ自体は変わらない）。結果の要素数は，オペランド双方の要素数の和となる。次の各例はTRUEとなる。

{ 1 2 3 } , { 4 5 6 } == { 1 2 3 4 5 6 }

配列1と配列2の型が異なるときは，配列2を配列1 の型に変換する。たとえば：

NUM { 1 2 3 } , STR { a b c } == NUM { 1 2 3 0 0 0 }

{ a b c }を数値に変換すると{ 0 0 0 }となることに注意。（Dintroのマニュアル参照。）

配列連結演算子の優先順位は算術演算子より低く，比較演算子より高い。

COUNTおよびEXISTS

COUNT 式

EXISTS 式

COUNTは式の要素の個数を示す単純数値を結果の値とする。

EXISTSは，式の要素数が1以上のとき単純数値1を，要素を持たないとき0を値とする。

優先順位は数学単項演算子と同じである

配列内統計

MIN 配列

MAX 配列

SUM 配列

AVG 配列

これらは単項演算子である。配列の要素に対する統計値を与える。配列は数値として評価する。 MIN，MAXは要素の最小，最大値， SUMは全要素の合計値， AVGはSUM/COUNTを値とする。次の例を参照：

COUNT { 1 2 3 4 5 6 } == CONST 6 COUNT { } == CONST 0 MIN { 1 2 3 4 5 6 } == CONST 1 MAX { 1 2 3 4 5 6 } == CONST 6 AVG { 1 2 3 4 5 6 } == CONST 10.5

優先順位は数学単項演算子と同じである

CAT演算子

CAT 配列

CATは単項演算子である。配列を文字列として評価し，この全要素を要素順に文字列連結したものを値とする。次の例を参照：

CAT { 1 2 3 4 5 6 } == CONST 123456

優先順位は数学単項演算子と同じである

この演算子の使用は推奨されない。より一般的なJOINの使用を薦める。

JOIN演算子

配列 JOIN 区切字

配列の各要素の間に区切字列 をはさんで連結する。結果は要素一つの文字列となる。

配列と区切字は必要があれば文字列に変換される。 区切字に複数要素があっても最初の要素だけが区切字列として使われる。 区切字が空値の場合， 区切字列は空文字列となる。

JOIN演算子の優先順位は，連結演算子より高く， SPRINTF，SSCANF演算子より低い。

配列 JOIN "" の機能は，CAT 配列と同じである。これは歴史的事情によるもので現在では CATの使用は推奨されない。また，JOINはperlからきた名称で， Djoinとは関係ない。この演算子の機能はむしろ Dpack と共通している。

GREP演算子

配列 GREP 演算子 式

演算子は，パターンマッチ演算子または，INCLを除く比較演算子である。配列の各要素について，その要素演算子式が評価され，値がTRUEであればその要素は選択される。結果は配列のうち選択された要素からなる配列である。もとの配列は変化しない。

GREPの典型的な使用例は次のようなもので，

FIELD words = FIELD words GREP UNLIKE "$[0-9]+$"

フィールドwordsのうち，数値の語が除去される。

演算子がパターンマッチ演算子の場合，配列および式は文字列として評価され，結果の配列も常に文字列となる。 演算子が比較演算子の場合，結果の配列は，配列のタイプによって文字列または数値となる。ただし，比較演算そのものは，演算子の数値/文字列比較を決定するルールに従い，どちらかの演算項が数値であれば数値比較，双方文字列であれば文字列比較が行われる。

たとえば，

FIELD a GREP GE 10

では，文字列比較が行われる。なぜなら，フィールドは文字列として評価され，CONST 10も文字列である。

次の二つの例は，いずれも数値比較が行われる。

FIELD a GREP GE NUM 10 FIELD a:n GREP GE 10

結果は，最初の例は文字列，2番目の例は数値配列となる。

通常，式は，単純値を与える。もし，複数の要素があった場合，演算子での規則によって単純値対配列での比較/パターンマッチが行われる。

GREP演算子の優先順位は，連結演算子より高く， SPRINTF，SSCANF演算子より低い。

SPLIT演算子

文字列式 SPLIT 区切字

文字列式の文字列を 区切字で与えられる正規表現区切字パターン で分解し，各部分を要素とする配列を作る。

文字列式も区切字も必要があれば文字列に変換される。 区切字の最初の要素だけが 区切字パターンとして使用される。他の要素はこの演算には使用されない。 区切字が空地の場合，空文字列となる。

文字列式に複数要素がある場合，各要素をすべて分解し，すべての分解した要素からなる配列を演算結果とする。

区切字パターンが空文字列にマッチする場合最初の1文字を分離する。したがって，

CONST "abc" SPLIT CONST ""

の結果は，

{ a b c }

となる。

SPLIT演算子の優先順位は，連結演算子より高く， SPRINTF，SSCANF演算子より低い。

この演算子は， Dunpack と同様の機能を持っている。ただし， Dunpack では，空文字列にマッチする 区切字パターン は許されない。この演算では，空文字列にマッチする場合最初の1文字を分離する。

範囲演算子

開始 .. 終了

範囲演算子はperlのスカラー環境での範囲演算子に似ている。次の例が典型的な使い方を示す。

FOR i IN 0 .. COUNT a - 1 DO IF a [ VAR i ] =~ [0-9]+ THEN num = FIELD num , a [ VAR i ] FI DONE

開始と終了の双方を数値として評価する。さらに，開始の最後の要素と終了の最初の要素とを整数に変換する。その後，開始の最後以外の要素を，結果の配列にコピーする。次に開始の最後の要素（整数にしたもの）から始まって，終了の最初の要素（整数）までの整数値をその後ろに埋める。最後に終了の2番目以降の要素をその後に追加する。整数値を埋めるときの間隔は開始の最後の要素と終了の最初の要素のどちらが大きいかにしたがって， 1または-1とする。次の例を参照：

{ 0.5 1.5 } .. { -1.5 -0.5 } == { 0.5 1 0 -1 -0.5 }

（なぜ0.5と-0.5とが整数に変換されないのか疑問を持つかもしれない。特に理由はない。ただ，この方が実装上やや楽ではあった。）

範囲演算子の優先順位は配列連結演算子より高く，算術演算子より低い。結合順序は，左からである。

添え字演算子

配列 [ 添え字式 ]

添え字式は数値として評価し整数に変換する。添え字演算の結果は，配列の要素のうち，添え字式 で指定される順番のものである。要素の順番は，先頭をゼロ番目として数える。添え字が配列の範囲を超えていた場合，結果は空値となる。添え字が配列の場合，結果もまた配列で，そのi番目の要素は配列の「添え字式のi番目の要素番目」の要素とする。

次の例はすべてTRUEとなる。

{ 1 2 3 } [ 0 ] == { 1 } { a b c } [ 1.5 ] == { b } { 1 2 3 } [ -1 ] == { } { a b c } [ 3 ] == { } { 1 2 3 } [ { 0 1 } ] == { 1 2 } { a b c } [ { 2 1 0 } ] == { c b a } { a b c } [ { 1 2 3 } ] == { b c }

foo [ 1 ] [ 0 ]は構文的には正しい式である。しかし，これはfoo [ 1 ]と同じで， 2次元配列となるわけではないことに注意せよ。 C言語等と異なり，Dlには1次元配列しかない。

代入演算子

LHE = 式

LHE [ 添え字式 ] = 式

代入演算子は，式を評価してその値を左辺式（LHE）にいれ，また結果の値としてその値をとる。

LHEは， フィールド名，変数， 静的変数， カレントレコード特殊変数 のいずれかに限られる。 LHEに添え字演算子のついたとき， 添え字式は数値として評価し整数に変換される。代入対象はLHEの添え字で指定された要素に限定される。

式の型がLHEと異なるときは，式をLHE の型に変換する。たとえばVARの最初の使用時などLHEに型のないときは，式の型がLHEの型となる。なお，フィールド名とカレントレコード特殊変数は常に文字列型である。

LHEがフィールド名の場合，カレントレコード中のフィールド順は可能な限り保持される。たとえば，カレントレコードが，

a:A b:B

で，プログラムが，

FIELD a = CONST foo

のばあい，結果は，

a:foo b:B

となる。フィールド"a"は動かない。

ターゲットフィールドも式も配列であってよい。双方の要素数が等しい場合，対応する要素をフィールド位置を保持しながら代入する。ターゲットフィールドの方が式より多くの要素を持つ場合，超過分のフィールドはカレントレコードから消去される。ターゲットフィールドの要素の方が少ない場合，超過したフィールドは，ターゲットフィールドの最後のものの直後に追加される。

たとえば，カレントレコードが

a:A b:AA a:B b:BB

で，プログラムが

FIELD a = { 0 1 2 3 }

のとき，結果は次のようになる。

a:0 b:AA a:1 a:2 a:3 b:BB

ターゲットフィールドがカレントレコード中にない新しいものであるときフィールドはレコードの最後に追加される。

LHEに添え字演算子のついた場合，代入対象は，添え字式で指定した要素に限定される。

たとえば，カレントレコード（変数や静的変数でも同じであるが）が次のようだったとする。

a:AA a:BB a:CC

プログラムが，

a [ 1 ] = { 1 }

とすると結果は次のようになる。

a:AA a:1 a:CC

式が次のような配列の場合，

a [ 1 ] = { 1 2 }

対象となる要素が配列で置き換えられて次のようになる。

a:AA a:1 a:2 a:CC

式が空値の場合，

a [ 1 ] = { }

要素の削除を意味し，結果は次のようになる。

a:AA a:CC

添え字式がLHEの現在持っている要素の範囲外を指定した場合，代入した値は消えてなくなる。（perlのように，添え字式の拡張が行われるわけではないので注意。）

LHEに対する添え字式が配列の場合，規則は「原則1対1，過不足は最後の要素に」というものである。

たとえば，ある変数aが次の値を持っていたとする。

{ AA BB CC DD }

プログラムが次のようであると，

VAR a [ { 0 2 } ] = { 0 2 }

結果は{ 0 BB 2 DD }となる。

値の方が要素数が多い場合は，

VAR a [ { 0 2 } ] = { 0 2 4 6 }

結果は，{ 0 BB 2 4 6 DD }となる。

値の方が要素数が少ない場合は，

VAR a [ { 0 2 } ] = { 0 }

変数aの要素が削除されて{ 0 BB DD }となる。

代入演算子の優先順位は，最低順位である逐次実行演算子のすぐ上である。

入出力関連特殊変数

`OUTPUT`	カレントレコードの出力
`FILENAME`	入力ファイル名
`FNR REC#`	カレントレコード番号（入力ファイル内）
`NR $.`	カレントレコード番号（全入力ファイル通算）
`@_ CURREC FIELDS`	カレントレコード自体

特殊変数にはオペランドはない。

出力

この特殊変数を評価すると，Dl処理系は，カレントレコードを標準出力に書き出す。カレントレコード自体は変化しない。したがって，明示的にカレントレコードを削除しない限り，カレントレコード実行サイクルの最後に再びカレントレコードが出力される。結果の値は，常に単純数値1を返す。

カレント入力ファイル名

この特殊変数は，カレント入力ファイル名を値とする。入力ファイルが標準入力の場合，値は空文字列となる。

カレントレコード番号

この特殊変数は，カレント入力ファイルの中でのカレントレコードのレコード番号（1から始まる）を値とする。歴史的事情でこの特殊変数は2つの名前を持っている。 REC#はDprのヘッダ行に現れる。 FNRはawkで使われている名称である。

通算カレントレコード番号

この特殊変数は，全入力ファイルを通算したカレントレコード番号を値とする。入力ファイルが1つであれば，FNRと等しい。 NRはawkコンパティブルな名称， $.はperlコンパティブルな名称である。

カレントレコード特殊変数

この特殊変数は，なまのカレントレコードである。カレントレコードの各フィールドが， Dファイル上のフィールド名，COLON，値という形のままの文字列として，この変数の要素となる。

この特殊変数への代入は，当然，カレントレコードの変更となる。各要素の値が，Dファイルのフィールド規約を守ったものとするのはユーザの責任で行う。

この特殊変数に空値を代入すると，

CURREC = { }

カレントレコードの削除となる。（ただし，その後で値を代入しないかぎり。）

この特殊変数はCURREC，FIELDSおよび @_という3つの名前を持っている。 @_は，perl風の名称で，perl と同じ意味ではないが， perlユーザには覚えやすいだろう。 CURRECは当然"current record"の略であるが， COUNT CURRECのような場合，意味的にやや不自然な印象となり，COUNT FIELDSの方が自然である。このためこれらの別形が用意されている。どれを使うかは自由である。

システム関連演算子と特殊変数

`QX`	システムコマンドの実行
`$?` `STATUS`	QXのリターンコード
`CODESET`	実効文字コード
`LOCALE`	カレントロケールの値

QX

QX コマンド

QXは単項演算子である。 Unixシェルのバックティック（`コマンド`）にあたる。 コマンドは，必要ならば文字列に変換され，シェルでコマンドとして実行される。実行結果の標準出力の文字列が演算結果となる。

標準出力が複数行になるとき，結果は各行を要素とした配列となる。（したがって，改行文字が結果に含まれることはない）。また，コマンドが配列の場合，各要素の間に改行文字をはさんで一つの文字列とし，これをシェルにわたす。ただし，シェルが2行目以下をしかるべく処理してくれるかどうかは，オペレーティングシステムによる。（Windowsのシェルcmd.exeは， 2行以上のコマンドは正しく処理しない）。

QX演算子の優先順位は範囲演算子より高く，算術演算子より低い。したがって次の例では () を使用しなくてもよい。

r = QX "command " . FIELD p ;

ただし，次の例のように（）を使う場合は CONSTを忘れないようにすること。

r = QX '(' CONST "command " . FIELD p ')' ;

さもないと，"command "はフィールド名として解釈されてしまう。

QXの名称はperlのqx/command/演算子に由来する。

STATUS

この特殊変数は，最後に行われたQXでのコマンド実行結果のリターンコードを保持する。最初のQXが実行されるまで，この値は0である。

$?はUnixのsh風の名前， STATUSはUnixのcsh風の名前である。

CODESET

この特殊変数は，Dコマンドの使用する文字コード（エンコーディング）名称を保持する。通常この値は，カレントロケールのエンコーディング名である。 UTF入出力機能が有効な場合， "UTF-8"，"UTF-16LE"，"UTF-16BE"， "UTF-32LE"または"UTF-32BE"となる。入力と出力のエンコーディングが異なるとき，この値は"入力エンコーディング名/出力エンコーディング名"の形となる。

CODESETは，XMLの"encoding"属性や，HTMLの"charset"名をセットするのに有用である。

LOCALE

この特殊変数はカレントロケールの値を保持する。 UNIXではsetlocale(LC_ALL, "")の戻り値， Windowsではsetlocale(LC_CTYPE, "")の戻り値である。

演算子の優先順位

演算子	結合順序
`[ ]`	左→右
`- ABS ATAN AVG CAPS CAT COS COUNT EXISTS EXP INT LENGTH LOG LOG10 MAX MIN NUM SIN SQRT STR SUM TAN TOLOWER TOUPPER`	右→左
`SPRINTF SSCANF`	左→右
`GREP JOIN SPLIT SUBSTR`	左→右
`BY S SG SUBST SUBSTG`	左→右
`.`	左→右
`** POWER`	左→右
`% * / DIVIDEDBY MOD TIMES`	左→右
`+ - MINUS PLUS`	左→右
`QX`	右→左
`..`	左→右
`,`	左→右
`!= !~ < <= <> == =~ > >= EQ GE GT INCL LE LIKE LT NE UNLIKE`	左→右
`! NOT`	右→左
`&& AND`	右→左
`OR \|\|`	右→左
`=`	右→左
`;`	右→左

演算子の優先順位が期待通りとは限らないので，少しでも疑問がある場合，括弧を使用することを薦める。

`one\ word`	`one word`
`"one word"`	`one word`
`'one word'`	`one word`
`one" "word`	`one word`
`o\ n" "e' '' '"w o ""r d"`	`o n e w o r d`
`\o\n\e\ \w\o\r\d`	`one word`
`one\ word`	`oneword`
`\\\"\'`	`\"'`
`"\"\\'\""`	`"\'"`
`"one\ word"`	`oneword`
`'"\"'`	`"\"`
`'one word'`	`one word`

Dl - D用言語

はじめに

Dlとは

Dlの特徴

DedとDselect

記法

ワードとクォーティング

予約語

コメント

トークン

文法

構文要素

フィールド名

形式

予約語FIELDの省略

フィールド名トークンの評価

数値限定子

定数

形式

予約語CONSTの省略

定数の評価

変数と静的変数

形式

変数の寿命

変数の評価

特殊変数

括弧

エンドトークン

評価（実行）

ブール値評価

演算子および関連特殊変数

制御演算子

逐次実行演算子

条件演算子

Whileループ演算子

Forループ演算子

プログラム終了

エピローグモードフラグ

比較演算子

インクルード演算子

パターンマッチ・置換演算子・マッチ後特殊変数

パターンマッチ演算子

置換演算子

マッチ後特殊変数

論理演算子

論理否定

論理積・論理和

算術演算子

数学演算子

文字列演算子

連結演算子

部分文字列演算子

文字数演算子

大小文字化演算子

変換演算子

数値変換演算子

文字列変換演算子

整数変換演算子

Sprintf変換演算子

Sscanf変換演算子

配列演算子

配列連結演算子

COUNTおよびEXISTS

配列内統計

CAT演算子

JOIN演算子

GREP演算子

SPLIT演算子

範囲演算子

添え字演算子

代入演算子

入出力関連特殊変数

出力

カレント入力ファイル名

カレントレコード番号

通算カレントレコード番号

カレントレコード特殊変数

システム関連演算子と特殊変数

QX

STATUS