bambooflow Note

先読みについて

最終更新：2010年10月24日 14:14

bambooflow

- view

メンバー限定登録/ログイン

ANTLR v3先読みについて

ANTLR LL(k)について、先読みを自分なりに理解してみました。

ANTLRは自動で先読みしてくれます。

たとえば、次の場合、

grammar A;
 
stat  : 'a' 'b'* 'c'
      | 'a' 'b'* 'd'
      ;

これだと'a' 'b'*までは同じなので、'c'もしくは'd'がくるまで、どちらでパースしてよいかわかりません。ですが、ANTLRはデフォルトで自動先読みして正しくパースしてくれます。

次の二つを試してみます。

abbbbbbc

abbbbbbd

Debug実行すると、一旦abbbbbbを先読みし、次がcなのかdなのか判断した後、マッチした方を再度abbbbb...とパースするのがわかります。

自動先読みは楽ですが、文法が複雑になるとバックトラック発生が増え、指数関数的に遅くなる傾向があります。

先読みのトークンの数をkで明示的に指定することができます。

grammar A;
 
options { k=3; }
 
stat  : 'a' 'b'* 'c'
      | 'a' 'b'* 'd'
      ;

このｔき先読みするトークン数は3です。

abd

abbd

abbまでは先読みするが次がcなのかdなのか判断できず失敗します。
そんなときにSyntactic Predicateを使います。

(«subrule»)=>

grammar A;
 
options { k=3; }
 
stat  : ('a' 'b'* 'c') => 'a' 'b'* 'c'
      | 'a' 'b'* 'd'
      ;

すると、一旦('a' 'b'* 'c')がマッチするかを判断して分岐するので、abbbdを正しくパースします。
先読みしたトークンは消費しません。

タグ：

ANTLR

bambooflow Note

記事メニュー

今日: -
昨日: -
総合: -

取得中です。

人気記事ランキング

最近更新されたページ

人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう！

全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう！