mercurial-scm/hg-stable: mercurial/revsetlang.py comparison

comparison mercurial/revsetlang.py @ 31450:80c8a6db450d

py3: use bytestr wrapper in revsetlang.tokenize() This backs out 77270ec0cdd9 and wraps program by bytestr() instead.

author	Yuya Nishihara <yuya@tcha.org>
date	Thu, 16 Mar 2017 21:36:21 +0900
parents	f784ba187089
children	553ad16b274f

comparison

equal deleted inserted replaced

-:f784ba187089
+:80c8a6db450d
 Check that @ is a valid unquoted token character (issue3686):
 >>> list(tokenize("@::"))
 [('symbol', '@', 0), ('::', None, 1), ('end', None, 3)]
 '''
+program = pycompat.bytestr(program)
 if syminitletters is None:
 syminitletters = _syminitletters
 if symletters is None:
 symletters = _symletters
 yield ('end', None, len(program))
 return
 pos, l = 0, len(program)
 while pos < l:
-c = program[pos:pos + 1]
+c = program[pos]
 if c.isspace(): # skip inter-token whitespace
 pass
 elif c == ':' and program[pos:pos + 2] == '::': # look ahead carefully
 yield ('::', None, pos)
 pos += 1 # skip ahead
 yield (c, None, pos)
 elif (c in _quoteletters or c == 'r' and
 program[pos:pos + 2] in ("r'", 'r"')): # handle quoted strings
 if c == 'r':
 pos += 1
-c = program[pos:pos + 1]
+c = program[pos]
 decode = lambda x: x
 else:
 decode = parser.unescapestr
 pos += 1
 s = pos
 while pos < l: # find closing quote
-d = program[pos:pos + 1]
+d = program[pos]
 if d == '\\': # skip over escaped characters
 pos += 2
 continue
 if d == c:
 yield ('string', decode(program[s:pos]), s)
 # gather up a symbol/keyword
 elif c in syminitletters:
 s = pos
 pos += 1
 while pos < l: # find end of symbol
-d = program[pos:pos + 1]
+d = program[pos]
 if d not in symletters:
 break
-if (d == '.'
+if d == '.' and program[pos - 1] == '.': # special case for ..
-and program[pos - 1:pos] == '.'): # special case for ..
 pos -= 1
 break
 pos += 1
 sym = program[s:pos]
 if sym in keywords: # operator keywords

Mercurial > public > mercurial-scm > hg-stable

comparison mercurial/revsetlang.py @ 31450:80c8a6db450d