天泣記

Ruby の多重代入において、配列の分解には丸括弧 "(", ")" を使うが、これがなぜ角括弧 "[", "]" でないのかという疑問がある。

また、多重代入の左辺におけるカンマの扱いもかなり謎である。

配列の分解は ML や Haskell のパターンマッチのしょぼいやつと思えば、生成と分解には同じ形式を使用するのが自然である。具体的には、配列の生成には角括弧をつかうのだから、分解にも角括弧を使うほうが明らかに自然である。

では、角括弧を使えない理由があるかと考えると、パーサの都合はそれなりにある。

仮に、生成時の配列の文法をそのまま代入の左辺に使えるとしてみよう。そうすると、[a, b, c] = [1, 2, 3] と記述できることになる。

ここで、[a, b, c] は左辺であるが、単独で [a, b, c] が表れたときには、配列を生成する式とみなせる。つまり、パーサが左から読んでいったとき、[a, b, c] が左辺であるかどうかは = を見つけるまではわからない。したがって、a, のところまで読んで、a に対応する構文木を生成する場合、これは左辺の一部かどうかはわからず、後でどうにかする必要がある。

これに対し丸括弧を使うと、同様な文は (a, b, c) = [1, 2, 3] と記述することになる。

ここで、(a, b, c) は左辺であるが、角括弧の場合と異なり、普通の式とはみなせない。(C と違い Ruby にはカンマオペレータはない) つまり、パーサが左から読んでいったとき、最初のカンマを見つけた時点で、普通の式ではないことがわかり、左辺と判断できる。したがって、a, のところまで読んで a に対応する構文木を生成する場合、これは左辺の一部であることがわかっているので、左辺用のノードを生成することができる。

さて、丸括弧ならばいつも区別できるかというと、そうでもない。配列の角括弧を丸括弧にすると、カンマという手がかりが使えるようになるが、配列にはカンマを使わない場合がある。カンマを使うのは 2要素以上で、それ未満であれば使わないのである。

とすると (a) = val などという場合は、a が左辺の一部であることを判断するには = まで待たなければならない。ここで、ネストすると ((((((((((a)))))))))) = val とかなるわけで、a と = の間には任意個のトークンが入りうる。ということは有限個のトークンの先読みで判断するのは無理である。そして、Ruby が使っている yacc は LALR(1) なので無理である。

これに対して Ruby がどう対処しているかというと、1要素でもカンマを必須にするというものである。つまり、((((((((((a,)))))))))) = val と記述するのである。こうすればたしかに、変数 (や他の代入対象) の直後にカンマが表れるので、先読みひとつで判断ができる。

これで、1要素以上の配列に対応する記法が用意できたことになる。

というように、パーサの都合をみてとることは可能である。しかしこれはネガティブな理由であり、丸括弧が素晴らしいという理由ではない。

角括弧よりも丸括弧のほうが良いという理由はあげられるだろうか?

天泣記

2007-07-02 (Mon)

2007-07-03 (Tue)

2007-07-04 (Wed)

2007-07-05 (Thu)

2007-07-06 (Fri)

2007-07-07 (Sat)

2007-07-08 (Sun)

2007-07-09 (Mon)

2007-07-13 (Fri)

2007-07-14 (Sat)

2007-07-15 (Sun)

2007-07-18 (Wed)

2007-07-19 (Thu)

2007-07-20 (Fri)

2007-07-21 (Sat)

2007-07-23 (Mon)

2007-07-24 (Tue)

2007-07-25 (Wed)

2007-07-27 (Fri)

2007-07-30 (Mon)