mercurial-scm/hg-stable: mercurial/parser.py annotate

annotate mercurial/parser.py @ 11274:77272d28b53f

revset: introduce basic parser

author	Matt Mackall <mpm@selenic.com>
date	Tue, 01 Jun 2010 11:18:57 -0500
parents
children	7df88cdf47fd

rev	line source
11274 77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	1 # parser.py - simple top-down operator precedence parser for mercurial
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	2 #
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	3 # Copyright 2010 Matt Mackall <mpm@selenic.com>
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	4 #
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	5 # This software may be used and distributed according to the terms of the
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	6 # GNU General Public License version 2 or any later version.
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	7
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	8 # see http://effbot.org/zone/simple-top-down-parsing.txt and
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	9 # http://eli.thegreenplace.net/2010/01/02/top-down-operator-precedence-parsing/
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	10 # for background
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	11
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	12 # takes a tokenizer and elements
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	13 # tokenizer is an iterator that returns type, value pairs
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	14 # elements is a mapping of types to binding strength, prefix and infix actions
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	15 # an action is a tree node name, a tree label, and an optional match
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	16 # __call__(program) parses program into a labelled tree
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	17
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	18 class parser(object):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	19 def __init__(self, tokenizer, elements, methods=None):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	20 self._tokenizer = tokenizer
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	21 self._elements = elements
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	22 self._methods = methods
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	23 def _advance(self):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	24 'advance the tokenizer'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	25 t = self.current
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	26 self.current = self._iter.next()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	27 return t
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	28 def _match(self, m):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	29 'make sure the tokenizer matches an end condition'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	30 if self.current[0] != m:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	31 raise SyntaxError(self.current)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	32 self._advance()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	33 def _parse(self, bind=0):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	34 token, value = self._advance()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	35 # handle prefix rules on current token
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	36 prefix = self._elements[token][1]
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	37 if not prefix:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	38 raise SyntaxError("not a prefix: %s" % token)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	39 if len(prefix) == 1:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	40 expr = (prefix[0], value)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	41 else:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	42 if len(prefix) > 2 and prefix[2] == self.current[0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	43 self._match(prefix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	44 expr = (prefix[0], None)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	45 else:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	46 expr = (prefix[0], self._parse(prefix[1]))
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	47 if len(prefix) > 2:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	48 self._match(prefix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	49 # gather tokens until we meet a lower binding strength
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	50 while bind < self._elements[self.current[0]][0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	51 token, value = self._advance()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	52 # handle infix rules
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	53 infix = self._elements[token][2]
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	54 if len(infix) == 3 and infix[2] == self.current[0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	55 self._match(infix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	56 expr = (infix[0], expr, (None))
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	57 else:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	58 if not infix[0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	59 raise SyntaxError("not an infix")
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	60 expr = (infix[0], expr, self._parse(infix[1]))
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	61 if len(infix) == 3:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	62 self._match(infix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	63 return expr
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	64 def parse(self, message):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	65 'generate a parse tree from a message'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	66 self._iter = self._tokenizer(message)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	67 self.current = self._iter.next()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	68 return self._parse()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	69 def eval(self, tree):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	70 'recursively evaluate a parse tree using node methods'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	71 if not isinstance(tree, tuple):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	72 return tree
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	73 return self._methods[tree[0]](*[self.eval(t) for t in tree[1:]])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	74 def __call__(self, message):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	75 'parse a message into a parse tree and evaluate if methods given'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	76 t = self.parse(message)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	77 if self._methods:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	78 return self.eval(t)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	79 return t

Mercurial > public > mercurial-scm > hg-stable

annotate mercurial/parser.py @ 11274:77272d28b53f