mercurial-scm/hg-stable: mercurial/revlog.py comparison

comparison mercurial/revlog.py @ 8650:ef393d6ec030

revlog: refactor chunk cache interface again - chunk to _chunk - _prime to _chunkraw - _chunkclear for cache clearing - _chunk calls _chunkraw - clean up _prime a bit - simplify users in revision and checkinlinesize - drop file descriptor passing (we're better off opening fds lazily

author	Matt Mackall <mpm@selenic.com>
date	Wed, 27 May 2009 16:01:34 -0500
parents	648af8a6aa41
children	782a85ee686f

comparison

equal deleted inserted replaced

-:2c097e22492c
+:ef393d6ec030
 d = self._io.parseindex(f, i, self._inline)
 except (ValueError, IndexError), e:
 raise RevlogError(_("index %s is corrupted") % (self.indexfile))
 self.index, self.nodemap, self._chunkcache = d
 if not self._chunkcache:
-self._chunkcache = (0, '')
+self._chunkclear()
 # add the magic null revision at -1 (if it hasn't been done already)
 if (self.index == [] or isinstance(self.index, lazyindex) or
 self.index[-1][7] != nullid) :
 self.index.append((0, 0, 0, -1, -1, -1, -1, nullid))
 else:
 text = self.revision(self.node(base))
 l = len(text)
 for x in xrange(base + 1, rev + 1):
-l = mdiff.patchedsize(l, self.chunk(x))
+l = mdiff.patchedsize(l, self._chunk(x))
 return l
 """
 def reachable(self, node, stop=None):
 """return the set of all nodes ancestral to a given node, including
 if o + len(d) == offset and len(d) + len(data) < _prereadsize:
 self._chunkcache = o, d + data
 else:
 self._chunkcache = offset, data
-def _loadchunk(self, offset, length, df=None):
+def _loadchunk(self, offset, length):
-if not df:
+if self._inline:
-if self._inline:
+df = self.opener(self.indexfile)
-df = self.opener(self.indexfile)
+else:
-else:
+df = self.opener(self.datafile)
-df = self.opener(self.datafile)
 readahead = max(65536, length)
 df.seek(offset)
 d = df.read(readahead)
 self._addchunk(offset, d)
 if readahead > length:
 return d[:length]
 return d
-def _getchunk(self, offset, length, df=None):
+def _getchunk(self, offset, length):
 o, d = self._chunkcache
 l = len(d)
 # is it in the cache?
 cachestart = offset - o
 if cachestart >= 0 and cacheend <= l:
 if cachestart == 0 and cacheend == l:
 return d # avoid a copy
 return d[cachestart:cacheend]
-return self._loadchunk(offset, length, df)
+return self._loadchunk(offset, length)
-def _prime(self, startrev, endrev, df):
+def _chunkraw(self, startrev, endrev):
 start = self.start(startrev)
-end = self.end(endrev)
+length = self.end(endrev) - start
 if self._inline:
 start += (startrev + 1) * self._io.size
-end += (startrev + 1) * self._io.size
+return self._getchunk(start, length)
-self._loadchunk(start, end - start, df)
+def _chunk(self, rev):
-def chunk(self, rev, df=None):
+return decompress(self._chunkraw(rev, rev))
-start, length = self.start(rev), self.length(rev)
-if self._inline:
+def _chunkclear(self):
-start += (rev + 1) * self._io.size
+self._chunkcache = (0, '')
-return decompress(self._getchunk(start, length, df))
 def revdiff(self, rev1, rev2):
 """return or calculate a delta between two revisions"""
 if rev1 + 1 == rev2 and self.base(rev1) == self.base(rev2):
-return self.chunk(rev2)
+return self._chunk(rev2)
 return mdiff.textdiff(self.revision(self.node(rev1)),
 self.revision(self.node(rev2)))
 def revision(self, node):
 # check rev flags
 if self.index[rev][0] & 0xFFFF:
 raise RevlogError(_('incompatible revision flag %x') %
 (self.index[rev][0] & 0xFFFF))
-df = None
 # do we have useful data cached?
 if self._cache and self._cache[1] >= base and self._cache[1] < rev:
 base = self._cache[1]
 text = str(self._cache[2])
-self._loadindex(base, rev + 1)
-if not self._inline and rev > base + 1:
+self._loadindex(base, rev + 1)
-df = self.opener(self.datafile)
+self._chunkraw(base, rev)
-self._prime(base, rev, df)
+if text is None:
-else:
+text = self._chunk(base)
-self._loadindex(base, rev + 1)
-if not self._inline and rev > base:
+bins = [self._chunk(r) for r in xrange(base + 1, rev + 1)]
-df = self.opener(self.datafile)
-self._prime(base, rev, df)
-text = self.chunk(base, df=df)
-bins = [self.chunk(r, df) for r in xrange(base + 1, rev + 1)]
 text = mdiff.patches(text, bins)
 p1, p2 = self.parents(node)
 if node != hash(text, p1, p2):
 raise RevlogError(_("integrity check failed on %s:%d")
 % (self.indexfile, rev))
 fp.flush()
 fp.close()
 df = self.opener(self.datafile, 'w')
 try:
-calc = self._io.size
 for r in self:
-start = self.start(r) + (r + 1) * calc
+df.write(self._chunkraw(r, r))
-length = self.length(r)
-d = self._getchunk(start, length)
-df.write(d)
 finally:
 df.close()
 fp = self.opener(self.indexfile, 'w', atomictemp=True)
 self.version &= ~(REVLOGNGINLINEDATA)
 # if we don't call rename, the temp file will never replace the
 # real index
 fp.rename()
-tr.replace(self.indexfile, trindex * calc)
+tr.replace(self.indexfile, trindex * self._io.size)
-self._chunkcache = (0, '')
+self._chunkclear()
 def addrevision(self, text, transaction, link, p1, p2, d=None):
 """add a revision to the log
 text - the revision data to add
 transaction.add(self.indexfile, end)
 # then reset internal state in memory to forget those revisions
 self._cache = None
-self._chunkcache = (0, '')
+self._chunkclear()
 for x in xrange(rev, len(self)):
 del self.nodemap[self.node(x)]
 del self.index[rev:-1]

Mercurial > public > mercurial-scm > hg-stable

comparison mercurial/revlog.py @ 8650:ef393d6ec030