Annotation of 43BSD/bin/diff/diffreg.c, revision 1.1.1.1

1.1       root        1: static char sccsid[] = "@(#)diffreg.c 4.16 3/29/86";
                      2: 
                      3: #include "diff.h"
                      4: /*
                      5:  * diff - compare two files.
                      6:  */
                      7: 
                      8: /*
                      9:  *     Uses an algorithm due to Harold Stone, which finds
                     10:  *     a pair of longest identical subsequences in the two
                     11:  *     files.
                     12:  *
                     13:  *     The major goal is to generate the match vector J.
                     14:  *     J[i] is the index of the line in file1 corresponding
                     15:  *     to line i file0. J[i] = 0 if there is no
                     16:  *     such line in file1.
                     17:  *
                     18:  *     Lines are hashed so as to work in core. All potential
                     19:  *     matches are located by sorting the lines of each file
                     20:  *     on the hash (called ``value''). In particular, this
                     21:  *     collects the equivalence classes in file1 together.
                     22:  *     Subroutine equiv replaces the value of each line in
                     23:  *     file0 by the index of the first element of its 
                     24:  *     matching equivalence in (the reordered) file1.
                     25:  *     To save space equiv squeezes file1 into a single
                     26:  *     array member in which the equivalence classes
                     27:  *     are simply concatenated, except that their first
                     28:  *     members are flagged by changing sign.
                     29:  *
                     30:  *     Next the indices that point into member are unsorted into
                     31:  *     array class according to the original order of file0.
                     32:  *
                     33:  *     The cleverness lies in routine stone. This marches
                     34:  *     through the lines of file0, developing a vector klist
                     35:  *     of "k-candidates". At step i a k-candidate is a matched
                     36:  *     pair of lines x,y (x in file0 y in file1) such that
                     37:  *     there is a common subsequence of length k
                     38:  *     between the first i lines of file0 and the first y 
                     39:  *     lines of file1, but there is no such subsequence for
                     40:  *     any smaller y. x is the earliest possible mate to y
                     41:  *     that occurs in such a subsequence.
                     42:  *
                     43:  *     Whenever any of the members of the equivalence class of
                     44:  *     lines in file1 matable to a line in file0 has serial number 
                     45:  *     less than the y of some k-candidate, that k-candidate 
                     46:  *     with the smallest such y is replaced. The new 
                     47:  *     k-candidate is chained (via pred) to the current
                     48:  *     k-1 candidate so that the actual subsequence can
                     49:  *     be recovered. When a member has serial number greater
                     50:  *     that the y of all k-candidates, the klist is extended.
                     51:  *     At the end, the longest subsequence is pulled out
                     52:  *     and placed in the array J by unravel
                     53:  *
                     54:  *     With J in hand, the matches there recorded are
                     55:  *     check'ed against reality to assure that no spurious
                     56:  *     matches have crept in due to hashing. If they have,
                     57:  *     they are broken, and "jackpot" is recorded--a harmless
                     58:  *     matter except that a true match for a spuriously
                     59:  *     mated line may now be unnecessarily reported as a change.
                     60:  *
                     61:  *     Much of the complexity of the program comes simply
                     62:  *     from trying to minimize core utilization and
                     63:  *     maximize the range of doable problems by dynamically
                     64:  *     allocating what is needed and reusing what is not.
                     65:  *     The core requirements for problems larger than somewhat
                     66:  *     are (in words) 2*length(file0) + length(file1) +
                     67:  *     3*(number of k-candidates installed),  typically about
                     68:  *     6n words for files of length n. 
                     69:  */
                     70: 
                     71: #define        prints(s)       fputs(s,stdout)
                     72: 
                     73: FILE   *input[2];
                     74: FILE   *fopen();
                     75: 
                     76: struct cand {
                     77:        int     x;
                     78:        int     y;
                     79:        int     pred;
                     80: } cand;
                     81: struct line {
                     82:        int     serial;
                     83:        int     value;
                     84: } *file[2], line;
                     85: int    len[2];
                     86: struct line *sfile[2]; /* shortened by pruning common prefix and suffix */
                     87: int    slen[2];
                     88: int    pref, suff;     /* length of prefix and suffix */
                     89: int    *class;         /* will be overlaid on file[0] */
                     90: int    *member;        /* will be overlaid on file[1] */
                     91: int    *klist;         /* will be overlaid on file[0] after class */
                     92: struct cand *clist;    /* merely a free storage pot for candidates */
                     93: int    clen = 0;
                     94: int    *J;             /* will be overlaid on class */
                     95: long   *ixold;         /* will be overlaid on klist */
                     96: long   *ixnew;         /* will be overlaid on file[1] */
                     97: char   *chrtran;       /* translation table for case-folding */
                     98: 
                     99: /* chrtran points to one of 2 translation tables:
                    100:  *     cup2low if folding upper to lower case
                    101:  *     clow2low if not folding case
                    102:  */
                    103: char   clow2low[256] = {
                    104: 0x00,0x01,0x02,0x03,0x04,0x05,0x06,0x07,0x08,0x09,0x0a,0x0b,0x0c,0x0d,0x0e,0x0f,
                    105: 0x10,0x11,0x12,0x13,0x14,0x15,0x16,0x17,0x18,0x19,0x1a,0x1b,0x1c,0x1d,0x1e,0x1f,
                    106: 0x20,0x21,0x22,0x23,0x24,0x25,0x26,0x27,0x28,0x29,0x2a,0x2b,0x2c,0x2d,0x2e,0x2f,
                    107: 0x30,0x31,0x32,0x33,0x34,0x35,0x36,0x37,0x38,0x39,0x3a,0x3b,0x3c,0x3d,0x3e,0x3f,
                    108: 0x40,0x41,0x42,0x43,0x44,0x45,0x46,0x47,0x48,0x49,0x4a,0x4b,0x4c,0x4d,0x4e,0x4f,
                    109: 0x50,0x51,0x52,0x53,0x54,0x55,0x56,0x57,0x58,0x59,0x5a,0x5b,0x5c,0x5d,0x5e,0x5f,
                    110: 0x60,0x61,0x62,0x63,0x64,0x65,0x66,0x67,0x68,0x69,0x6a,0x6b,0x6c,0x6d,0x6e,0x6f,
                    111: 0x70,0x71,0x72,0x73,0x74,0x75,0x76,0x77,0x78,0x79,0x7a,0x7b,0x7c,0x7d,0x7e,0x7f,
                    112: 0x80,0x81,0x82,0x83,0x84,0x85,0x86,0x87,0x88,0x89,0x8a,0x8b,0x8c,0x8d,0x8e,0x8f,
                    113: 0x90,0x91,0x92,0x93,0x94,0x95,0x96,0x97,0x98,0x99,0x9a,0x9b,0x9c,0x9d,0x9e,0x9f,
                    114: 0xa0,0xa1,0xa2,0xa3,0xa4,0xa5,0xa6,0xa7,0xa8,0xa9,0xaa,0xab,0xac,0xad,0xae,0xaf,
                    115: 0xb0,0xb1,0xb2,0xb3,0xb4,0xb5,0xb6,0xb7,0xb8,0xb9,0xba,0xbb,0xbc,0xbd,0xbe,0xbf,
                    116: 0xc0,0xc1,0xc2,0xc3,0xc4,0xc5,0xc6,0xc7,0xc8,0xc9,0xca,0xcb,0xcc,0xcd,0xce,0xcf,
                    117: 0xd0,0xd1,0xd2,0xd3,0xd4,0xd5,0xd6,0xd7,0xd8,0xd9,0xda,0xdb,0xdc,0xdd,0xde,0xdf,
                    118: 0xe0,0xe1,0xe2,0xe3,0xe4,0xe5,0xe6,0xe7,0xe8,0xe9,0xea,0xeb,0xec,0xed,0xee,0xef,
                    119: 0xf0,0xf1,0xf2,0xf3,0xf4,0xf5,0xf6,0xf7,0xf8,0xf9,0xfa,0xfb,0xfc,0xfd,0xfe,0xff
                    120: };
                    121: 
                    122: char   cup2low[256] = {
                    123: 0x00,0x01,0x02,0x03,0x04,0x05,0x06,0x07,0x08,0x09,0x0a,0x0b,0x0c,0x0d,0x0e,0x0f,
                    124: 0x10,0x11,0x12,0x13,0x14,0x15,0x16,0x17,0x18,0x19,0x1a,0x1b,0x1c,0x1d,0x1e,0x1f,
                    125: 0x20,0x21,0x22,0x23,0x24,0x25,0x26,0x27,0x28,0x29,0x2a,0x2b,0x2c,0x2d,0x2e,0x2f,
                    126: 0x30,0x31,0x32,0x33,0x34,0x35,0x36,0x37,0x38,0x39,0x3a,0x3b,0x3c,0x3d,0x3e,0x3f,
                    127: 0x60,0x61,0x62,0x63,0x64,0x65,0x66,0x67,0x68,0x69,0x6a,0x6b,0x6c,0x6d,0x6e,0x6f,
                    128: 0x70,0x71,0x72,0x73,0x74,0x75,0x76,0x77,0x78,0x79,0x7a,0x7b,0x7c,0x7d,0x7e,0x7f,
                    129: 0x60,0x61,0x62,0x63,0x64,0x65,0x66,0x67,0x68,0x69,0x6a,0x6b,0x6c,0x6d,0x6e,0x6f,
                    130: 0x70,0x71,0x72,0x73,0x74,0x75,0x76,0x77,0x78,0x79,0x7a,0x7b,0x7c,0x7d,0x7e,0x7f,
                    131: 0x80,0x81,0x82,0x83,0x84,0x85,0x86,0x87,0x88,0x89,0x8a,0x8b,0x8c,0x8d,0x8e,0x8f,
                    132: 0x90,0x91,0x92,0x93,0x94,0x95,0x96,0x97,0x98,0x99,0x9a,0x9b,0x9c,0x9d,0x9e,0x9f,
                    133: 0xa0,0xa1,0xa2,0xa3,0xa4,0xa5,0xa6,0xa7,0xa8,0xa9,0xaa,0xab,0xac,0xad,0xae,0xaf,
                    134: 0xb0,0xb1,0xb2,0xb3,0xb4,0xb5,0xb6,0xb7,0xb8,0xb9,0xba,0xbb,0xbc,0xbd,0xbe,0xbf,
                    135: 0xc0,0xc1,0xc2,0xc3,0xc4,0xc5,0xc6,0xc7,0xc8,0xc9,0xca,0xcb,0xcc,0xcd,0xce,0xcf,
                    136: 0xd0,0xd1,0xd2,0xd3,0xd4,0xd5,0xd6,0xd7,0xd8,0xd9,0xda,0xdb,0xdc,0xdd,0xde,0xdf,
                    137: 0xe0,0xe1,0xe2,0xe3,0xe4,0xe5,0xe6,0xe7,0xe8,0xe9,0xea,0xeb,0xec,0xed,0xee,0xef,
                    138: 0xf0,0xf1,0xf2,0xf3,0xf4,0xf5,0xf6,0xf7,0xf8,0xf9,0xfa,0xfb,0xfc,0xfd,0xfe,0xff
                    139: };
                    140: 
                    141: diffreg()
                    142: {
                    143:        register int i, j;
                    144:        FILE *f1, *f2;
                    145:        char buf1[BUFSIZ], buf2[BUFSIZ];
                    146: 
                    147:        if (hflag) {
                    148:                diffargv[0] = "diffh";
                    149:                execv(diffh, diffargv);
                    150:                fprintf(stderr, "diff: ");
                    151:                perror(diffh);
                    152:                done();
                    153:        }
                    154:        chrtran = (iflag? cup2low : clow2low);
                    155:        if ((stb1.st_mode & S_IFMT) == S_IFDIR) {
                    156:                file1 = splice(file1, file2);
                    157:                if (stat(file1, &stb1) < 0) {
                    158:                        fprintf(stderr, "diff: ");
                    159:                        perror(file1);
                    160:                        done();
                    161:                }
                    162:        } else if ((stb2.st_mode & S_IFMT) == S_IFDIR) {
                    163:                file2 = splice(file2, file1);
                    164:                if (stat(file2, &stb2) < 0) {
                    165:                        fprintf(stderr, "diff: ");
                    166:                        perror(file2);
                    167:                        done();
                    168:                }
                    169:        } else if (!strcmp(file1, "-")) {
                    170:                if (!strcmp(file2, "-")) {
                    171:                        fprintf(stderr, "diff: can't specify - -\n");
                    172:                        done();
                    173:                }
                    174:                file1 = copytemp();
                    175:                if (stat(file1, &stb1) < 0) {
                    176:                        fprintf(stderr, "diff: ");
                    177:                        perror(file1);
                    178:                        done();
                    179:                }
                    180:        } else if (!strcmp(file2, "-")) {
                    181:                file2 = copytemp();
                    182:                if (stat(file2, &stb2) < 0) {
                    183:                        fprintf(stderr, "diff: ");
                    184:                        perror(file2);
                    185:                        done();
                    186:                }
                    187:        }
                    188:        if ((f1 = fopen(file1, "r")) == NULL) {
                    189:                fprintf(stderr, "diff: ");
                    190:                perror(file1);
                    191:                done();
                    192:        }
                    193:        if ((f2 = fopen(file2, "r")) == NULL) {
                    194:                fprintf(stderr, "diff: ");
                    195:                perror(file2);
                    196:                fclose(f1);
                    197:                done();
                    198:        }
                    199:        if (stb1.st_size != stb2.st_size)
                    200:                goto notsame;
                    201:        for (;;) {
                    202:                i = fread(buf1, 1, BUFSIZ, f1);
                    203:                j = fread(buf2, 1, BUFSIZ, f2);
                    204:                if (i < 0 || j < 0 || i != j)
                    205:                        goto notsame;
                    206:                if (i == 0 && j == 0) {
                    207:                        fclose(f1);
                    208:                        fclose(f2);
                    209:                        status = 0;             /* files don't differ */
                    210:                        goto same;
                    211:                }
                    212:                for (j = 0; j < i; j++)
                    213:                        if (buf1[j] != buf2[j])
                    214:                                goto notsame;
                    215:        }
                    216: notsame:
                    217:        /*
                    218:         *      Files certainly differ at this point; set status accordingly
                    219:         */
                    220:        status = 1;
                    221:        if (!asciifile(f1) || !asciifile(f2)) {
                    222:                printf("Binary files %s and %s differ\n", file1, file2);
                    223:                fclose(f1);
                    224:                fclose(f2);
                    225:                done();
                    226:        }
                    227:        prepare(0, f1);
                    228:        prepare(1, f2);
                    229:        fclose(f1);
                    230:        fclose(f2);
                    231:        prune();
                    232:        sort(sfile[0],slen[0]);
                    233:        sort(sfile[1],slen[1]);
                    234: 
                    235:        member = (int *)file[1];
                    236:        equiv(sfile[0], slen[0], sfile[1], slen[1], member);
                    237:        member = (int *)ralloc((char *)member,(slen[1]+2)*sizeof(int));
                    238: 
                    239:        class = (int *)file[0];
                    240:        unsort(sfile[0], slen[0], class);
                    241:        class = (int *)ralloc((char *)class,(slen[0]+2)*sizeof(int));
                    242: 
                    243:        klist = (int *)talloc((slen[0]+2)*sizeof(int));
                    244:        clist = (struct cand *)talloc(sizeof(cand));
                    245:        i = stone(class, slen[0], member, klist);
                    246:        free((char *)member);
                    247:        free((char *)class);
                    248: 
                    249:        J = (int *)talloc((len[0]+2)*sizeof(int));
                    250:        unravel(klist[i]);
                    251:        free((char *)clist);
                    252:        free((char *)klist);
                    253: 
                    254:        ixold = (long *)talloc((len[0]+2)*sizeof(long));
                    255:        ixnew = (long *)talloc((len[1]+2)*sizeof(long));
                    256:        check();
                    257:        output();
                    258:        status = anychange;
                    259: same:
                    260:        if (opt == D_CONTEXT && anychange == 0)
                    261:                printf("No differences encountered\n");
                    262:        done();
                    263: }
                    264: 
                    265: char *
                    266: copytemp()
                    267: {
                    268:        char buf[BUFSIZ];
                    269:        register int i, f;
                    270: 
                    271:        signal(SIGHUP,done);
                    272:        signal(SIGINT,done);
                    273:        signal(SIGPIPE,done);
                    274:        signal(SIGTERM,done);
                    275:        tempfile = mktemp("/tmp/dXXXXX");
                    276:        f = creat(tempfile,0600);
                    277:        if (f < 0) {
                    278:                fprintf(stderr, "diff: ");
                    279:                perror(tempfile);
                    280:                done();
                    281:        }
                    282:        while ((i = read(0,buf,BUFSIZ)) > 0)
                    283:                if (write(f,buf,i) != i) {
                    284:                        fprintf(stderr, "diff: ");
                    285:                        perror(tempfile);
                    286:                        done();
                    287:                }
                    288:        close(f);
                    289:        return (tempfile);
                    290: }
                    291: 
                    292: char *
                    293: splice(dir, file)
                    294:        char *dir, *file;
                    295: {
                    296:        char *tail;
                    297:        char buf[BUFSIZ];
                    298: 
                    299:        if (!strcmp(file, "-")) {
                    300:                fprintf(stderr, "diff: can't specify - with other arg directory\n");
                    301:                done();
                    302:        }
                    303:        tail = rindex(file, '/');
                    304:        if (tail == 0)
                    305:                tail = file;
                    306:        else
                    307:                tail++;
                    308:        sprintf(buf, "%s/%s", dir, tail);
                    309:        return (savestr(buf));
                    310: }
                    311: 
                    312: prepare(i, fd)
                    313:        int i;
                    314:        FILE *fd;
                    315: {
                    316:        register struct line *p;
                    317:        register j,h;
                    318: 
                    319:        fseek(fd, (long)0, 0);
                    320:        p = (struct line *)talloc(3*sizeof(line));
                    321:        for(j=0; h=readhash(fd);) {
                    322:                p = (struct line *)ralloc((char *)p,(++j+3)*sizeof(line));
                    323:                p[j].value = h;
                    324:        }
                    325:        len[i] = j;
                    326:        file[i] = p;
                    327: }
                    328: 
                    329: prune()
                    330: {
                    331:        register i,j;
                    332:        for(pref=0;pref<len[0]&&pref<len[1]&&
                    333:                file[0][pref+1].value==file[1][pref+1].value;
                    334:                pref++ ) ;
                    335:        for(suff=0;suff<len[0]-pref&&suff<len[1]-pref&&
                    336:                file[0][len[0]-suff].value==file[1][len[1]-suff].value;
                    337:                suff++) ;
                    338:        for(j=0;j<2;j++) {
                    339:                sfile[j] = file[j]+pref;
                    340:                slen[j] = len[j]-pref-suff;
                    341:                for(i=0;i<=slen[j];i++)
                    342:                        sfile[j][i].serial = i;
                    343:        }
                    344: }
                    345: 
                    346: equiv(a,n,b,m,c)
                    347: struct line *a, *b;
                    348: int *c;
                    349: {
                    350:        register int i, j;
                    351:        i = j = 1;
                    352:        while(i<=n && j<=m) {
                    353:                if(a[i].value <b[j].value)
                    354:                        a[i++].value = 0;
                    355:                else if(a[i].value == b[j].value)
                    356:                        a[i++].value = j;
                    357:                else
                    358:                        j++;
                    359:        }
                    360:        while(i <= n)
                    361:                a[i++].value = 0;
                    362:        b[m+1].value = 0;
                    363:        j = 0;
                    364:        while(++j <= m) {
                    365:                c[j] = -b[j].serial;
                    366:                while(b[j+1].value == b[j].value) {
                    367:                        j++;
                    368:                        c[j] = b[j].serial;
                    369:                }
                    370:        }
                    371:        c[j] = -1;
                    372: }
                    373: 
                    374: stone(a,n,b,c)
                    375: int *a;
                    376: int *b;
                    377: register int *c;
                    378: {
                    379:        register int i, k,y;
                    380:        int j, l;
                    381:        int oldc, tc;
                    382:        int oldl;
                    383:        k = 0;
                    384:        c[0] = newcand(0,0,0);
                    385:        for(i=1; i<=n; i++) {
                    386:                j = a[i];
                    387:                if(j==0)
                    388:                        continue;
                    389:                y = -b[j];
                    390:                oldl = 0;
                    391:                oldc = c[0];
                    392:                do {
                    393:                        if(y <= clist[oldc].y)
                    394:                                continue;
                    395:                        l = search(c, k, y);
                    396:                        if(l!=oldl+1)
                    397:                                oldc = c[l-1];
                    398:                        if(l<=k) {
                    399:                                if(clist[c[l]].y <= y)
                    400:                                        continue;
                    401:                                tc = c[l];
                    402:                                c[l] = newcand(i,y,oldc);
                    403:                                oldc = tc;
                    404:                                oldl = l;
                    405:                        } else {
                    406:                                c[l] = newcand(i,y,oldc);
                    407:                                k++;
                    408:                                break;
                    409:                        }
                    410:                } while((y=b[++j]) > 0);
                    411:        }
                    412:        return(k);
                    413: }
                    414: 
                    415: newcand(x,y,pred)
                    416: {
                    417:        register struct cand *q;
                    418:        clist = (struct cand *)ralloc((char *)clist,++clen*sizeof(cand));
                    419:        q = clist + clen -1;
                    420:        q->x = x;
                    421:        q->y = y;
                    422:        q->pred = pred;
                    423:        return(clen-1);
                    424: }
                    425: 
                    426: search(c, k, y)
                    427: int *c;
                    428: {
                    429:        register int i, j, l;
                    430:        int t;
                    431:        if(clist[c[k]].y<y)     /*quick look for typical case*/
                    432:                return(k+1);
                    433:        i = 0;
                    434:        j = k+1;
                    435:        while (1) {
                    436:                l = i + j;
                    437:                if ((l >>= 1) <= i) 
                    438:                        break;
                    439:                t = clist[c[l]].y;
                    440:                if(t > y)
                    441:                        j = l;
                    442:                else if(t < y)
                    443:                        i = l;
                    444:                else
                    445:                        return(l);
                    446:        }
                    447:        return(l+1);
                    448: }
                    449: 
                    450: unravel(p)
                    451: {
                    452:        register int i;
                    453:        register struct cand *q;
                    454:        for(i=0; i<=len[0]; i++)
                    455:                J[i] =  i<=pref ? i:
                    456:                        i>len[0]-suff ? i+len[1]-len[0]:
                    457:                        0;
                    458:        for(q=clist+p;q->y!=0;q=clist+q->pred)
                    459:                J[q->x+pref] = q->y+pref;
                    460: }
                    461: 
                    462: /* check does double duty:
                    463: 1.  ferret out any fortuitous correspondences due
                    464: to confounding by hashing (which result in "jackpot")
                    465: 2.  collect random access indexes to the two files */
                    466: 
                    467: check()
                    468: {
                    469:        register int i, j;
                    470:        int jackpot;
                    471:        long ctold, ctnew;
                    472:        register int c,d;
                    473: 
                    474:        if ((input[0] = fopen(file1,"r")) == NULL) {
                    475:                perror(file1);
                    476:                done();
                    477:        }
                    478:        if ((input[1] = fopen(file2,"r")) == NULL) {
                    479:                perror(file2);
                    480:                done();
                    481:        }
                    482:        j = 1;
                    483:        ixold[0] = ixnew[0] = 0;
                    484:        jackpot = 0;
                    485:        ctold = ctnew = 0;
                    486:        for(i=1;i<=len[0];i++) {
                    487:                if(J[i]==0) {
                    488:                        ixold[i] = ctold += skipline(0);
                    489:                        continue;
                    490:                }
                    491:                while(j<J[i]) {
                    492:                        ixnew[j] = ctnew += skipline(1);
                    493:                        j++;
                    494:                }
                    495:                if(bflag || wflag || iflag) {
                    496:                        for(;;) {
                    497:                                c = getc(input[0]);
                    498:                                d = getc(input[1]);
                    499:                                ctold++;
                    500:                                ctnew++;
                    501:                                if(bflag && isspace(c) && isspace(d)) {
                    502:                                        do {
                    503:                                                if(c=='\n')
                    504:                                                        break;
                    505:                                                ctold++;
                    506:                                        } while(isspace(c=getc(input[0])));
                    507:                                        do {
                    508:                                                if(d=='\n')
                    509:                                                        break;
                    510:                                                ctnew++;
                    511:                                        } while(isspace(d=getc(input[1])));
                    512:                                } else if ( wflag ) {
                    513:                                        while( isspace(c) && c!='\n' ) {
                    514:                                                c=getc(input[0]);
                    515:                                                ctold++;
                    516:                                        }
                    517:                                        while( isspace(d) && d!='\n' ) {
                    518:                                                d=getc(input[1]);
                    519:                                                ctnew++;
                    520:                                        }
                    521:                                }
                    522:                                if(chrtran[c] != chrtran[d]) {
                    523:                                        jackpot++;
                    524:                                        J[i] = 0;
                    525:                                        if(c!='\n')
                    526:                                                ctold += skipline(0);
                    527:                                        if(d!='\n')
                    528:                                                ctnew += skipline(1);
                    529:                                        break;
                    530:                                }
                    531:                                if(c=='\n')
                    532:                                        break;
                    533:                        }
                    534:                } else {
                    535:                        for(;;) {
                    536:                                ctold++;
                    537:                                ctnew++;
                    538:                                if((c=getc(input[0])) != (d=getc(input[1]))) {
                    539:                                        /* jackpot++; */
                    540:                                        J[i] = 0;
                    541:                                        if(c!='\n')
                    542:                                                ctold += skipline(0);
                    543:                                        if(d!='\n')
                    544:                                                ctnew += skipline(1);
                    545:                                        break;
                    546:                                }
                    547:                                if(c=='\n')
                    548:                                        break;
                    549:                        }
                    550:                }
                    551:                ixold[i] = ctold;
                    552:                ixnew[j] = ctnew;
                    553:                j++;
                    554:        }
                    555:        for(;j<=len[1];j++) {
                    556:                ixnew[j] = ctnew += skipline(1);
                    557:        }
                    558:        fclose(input[0]);
                    559:        fclose(input[1]);
                    560: /*
                    561:        if(jackpot)
                    562:                fprintf(stderr, "jackpot\n");
                    563: */
                    564: }
                    565: 
                    566: sort(a,n)      /*shellsort CACM #201*/
                    567: struct line *a;
                    568: {
                    569:        struct line w;
                    570:        register int j,m;
                    571:        struct line *ai;
                    572:        register struct line *aim;
                    573:        int k;
                    574: 
                    575:        if (n == 0)
                    576:                return;
                    577:        for(j=1;j<=n;j*= 2)
                    578:                m = 2*j - 1;
                    579:        for(m/=2;m!=0;m/=2) {
                    580:                k = n-m;
                    581:                for(j=1;j<=k;j++) {
                    582:                        for(ai = &a[j]; ai > a; ai -= m) {
                    583:                                aim = &ai[m];
                    584:                                if(aim < ai)
                    585:                                        break;  /*wraparound*/
                    586:                                if(aim->value > ai[0].value ||
                    587:                                   aim->value == ai[0].value &&
                    588:                                   aim->serial > ai[0].serial)
                    589:                                        break;
                    590:                                w.value = ai[0].value;
                    591:                                ai[0].value = aim->value;
                    592:                                aim->value = w.value;
                    593:                                w.serial = ai[0].serial;
                    594:                                ai[0].serial = aim->serial;
                    595:                                aim->serial = w.serial;
                    596:                        }
                    597:                }
                    598:        }
                    599: }
                    600: 
                    601: unsort(f, l, b)
                    602: struct line *f;
                    603: int *b;
                    604: {
                    605:        register int *a;
                    606:        register int i;
                    607:        a = (int *)talloc((l+1)*sizeof(int));
                    608:        for(i=1;i<=l;i++)
                    609:                a[f[i].serial] = f[i].value;
                    610:        for(i=1;i<=l;i++)
                    611:                b[i] = a[i];
                    612:        free((char *)a);
                    613: }
                    614: 
                    615: skipline(f)
                    616: {
                    617:        register i, c;
                    618: 
                    619:        for(i=1;(c=getc(input[f]))!='\n';i++)
                    620:                if (c < 0)
                    621:                        return(i);
                    622:        return(i);
                    623: }
                    624: 
                    625: output()
                    626: {
                    627:        int m;
                    628:        register int i0, i1, j1;
                    629:        int j0;
                    630:        input[0] = fopen(file1,"r");
                    631:        input[1] = fopen(file2,"r");
                    632:        m = len[0];
                    633:        J[0] = 0;
                    634:        J[m+1] = len[1]+1;
                    635:        if(opt!=D_EDIT) for(i0=1;i0<=m;i0=i1+1) {
                    636:                while(i0<=m&&J[i0]==J[i0-1]+1) i0++;
                    637:                j0 = J[i0-1]+1;
                    638:                i1 = i0-1;
                    639:                while(i1<m&&J[i1+1]==0) i1++;
                    640:                j1 = J[i1+1]-1;
                    641:                J[i1] = j1;
                    642:                change(i0,i1,j0,j1);
                    643:        } else for(i0=m;i0>=1;i0=i1-1) {
                    644:                while(i0>=1&&J[i0]==J[i0+1]-1&&J[i0]!=0) i0--;
                    645:                j0 = J[i0+1]-1;
                    646:                i1 = i0+1;
                    647:                while(i1>1&&J[i1-1]==0) i1--;
                    648:                j1 = J[i1-1]+1;
                    649:                J[i1] = j1;
                    650:                change(i1,i0,j1,j0);
                    651:        }
                    652:        if(m==0)
                    653:                change(1,0,1,len[1]);
                    654:        if (opt==D_IFDEF) {
                    655:                for (;;) {
                    656: #define        c i0
                    657:                        c = getc(input[0]);
                    658:                        if (c < 0)
                    659:                                return;
                    660:                        putchar(c);
                    661:                }
                    662: #undef c
                    663:        }
                    664:        if (anychange && opt == D_CONTEXT)
                    665:                dump_context_vec();
                    666: }
                    667: 
                    668: /*
                    669:  * The following struct is used to record change information when
                    670:  * doing a "context" diff.  (see routine "change" to understand the
                    671:  * highly mneumonic field names)
                    672:  */
                    673: struct context_vec {
                    674:        int     a;      /* start line in old file */
                    675:        int     b;      /* end line in old file */
                    676:        int     c;      /* start line in new file */
                    677:        int     d;      /* end line in new file */
                    678: };
                    679: 
                    680: struct context_vec     *context_vec_start,
                    681:                        *context_vec_end,
                    682:                        *context_vec_ptr;
                    683: 
                    684: #define        MAX_CONTEXT     128
                    685: 
                    686: /* indicate that there is a difference between lines a and b of the from file
                    687:    to get to lines c to d of the to file.
                    688:    If a is greater then b then there are no lines in the from file involved
                    689:    and this means that there were lines appended (beginning at b).
                    690:    If c is greater than d then there are lines missing from the to file.
                    691: */
                    692: change(a,b,c,d)
                    693: {
                    694:        int ch;
                    695:        int lowa,upb,lowc,upd;
                    696:        struct stat stbuf;
                    697: 
                    698:        if (opt != D_IFDEF && a>b && c>d)
                    699:                return;
                    700:        if (anychange == 0) {
                    701:                anychange = 1;
                    702:                if(opt == D_CONTEXT) {
                    703:                        printf("*** %s  ", file1);
                    704:                        stat(file1, &stbuf);
                    705:                        printf("%s--- %s        ",
                    706:                            ctime(&stbuf.st_mtime), file2);
                    707:                        stat(file2, &stbuf);
                    708:                        printf("%s", ctime(&stbuf.st_mtime));
                    709: 
                    710:                        context_vec_start = (struct context_vec *) 
                    711:                                                malloc(MAX_CONTEXT *
                    712:                                                   sizeof(struct context_vec));
                    713:                        context_vec_end = context_vec_start + MAX_CONTEXT;
                    714:                        context_vec_ptr = context_vec_start - 1;
                    715:                }
                    716:        }
                    717:        if (a <= b && c <= d)
                    718:                ch = 'c';
                    719:        else
                    720:                ch = (a <= b) ? 'd' : 'a';
                    721:        if(opt == D_CONTEXT) {
                    722:                /*
                    723:                 * if this new change is within 'context' lines of
                    724:                 * the previous change, just add it to the change
                    725:                 * record.  If the record is full or if this
                    726:                 * change is more than 'context' lines from the previous
                    727:                 * change, dump the record, reset it & add the new change.
                    728:                 */
                    729:                if ( context_vec_ptr >= context_vec_end ||
                    730:                     ( context_vec_ptr >= context_vec_start &&
                    731:                       a > (context_vec_ptr->b + 2*context) &&
                    732:                       c > (context_vec_ptr->d + 2*context) ) )
                    733:                        dump_context_vec();
                    734: 
                    735:                context_vec_ptr++;
                    736:                context_vec_ptr->a = a;
                    737:                context_vec_ptr->b = b;
                    738:                context_vec_ptr->c = c;
                    739:                context_vec_ptr->d = d;
                    740:                return;
                    741:        }
                    742:        switch (opt) {
                    743: 
                    744:        case D_NORMAL:
                    745:        case D_EDIT:
                    746:                range(a,b,",");
                    747:                putchar(a>b?'a':c>d?'d':'c');
                    748:                if(opt==D_NORMAL)
                    749:                        range(c,d,",");
                    750:                putchar('\n');
                    751:                break;
                    752:        case D_REVERSE:
                    753:                putchar(a>b?'a':c>d?'d':'c');
                    754:                range(a,b," ");
                    755:                putchar('\n');
                    756:                break;
                    757:         case D_NREVERSE:
                    758:                 if (a>b)
                    759:                         printf("a%d %d\n",b,d-c+1);
                    760:                 else {
                    761:                         printf("d%d %d\n",a,b-a+1);
                    762:                         if (!(c>d))
                    763:                            /* add changed lines */
                    764:                            printf("a%d %d\n",b, d-c+1);
                    765:                 }
                    766:                 break;
                    767:        }
                    768:        if(opt == D_NORMAL || opt == D_IFDEF) {
                    769:                fetch(ixold,a,b,input[0],"< ", 1);
                    770:                if(a<=b&&c<=d && opt == D_NORMAL)
                    771:                        prints("---\n");
                    772:        }
                    773:        fetch(ixnew,c,d,input[1],opt==D_NORMAL?"> ":"", 0);
                    774:        if ((opt ==D_EDIT || opt == D_REVERSE) && c<=d)
                    775:                prints(".\n");
                    776:        if (inifdef) {
                    777:                fprintf(stdout, "#endif %s\n", endifname);
                    778:                inifdef = 0;
                    779:        }
                    780: }
                    781: 
                    782: range(a,b,separator)
                    783: char *separator;
                    784: {
                    785:        printf("%d", a>b?b:a);
                    786:        if(a<b) {
                    787:                printf("%s%d", separator, b);
                    788:        }
                    789: }
                    790: 
                    791: fetch(f,a,b,lb,s,oldfile)
                    792: long *f;
                    793: FILE *lb;
                    794: char *s;
                    795: {
                    796:        register int i, j;
                    797:        register int c;
                    798:        register int col;
                    799:        register int nc;
                    800:        int oneflag = (*ifdef1!='\0') != (*ifdef2!='\0');
                    801: 
                    802:        /*
                    803:         * When doing #ifdef's, copy down to current line
                    804:         * if this is the first file, so that stuff makes it to output.
                    805:         */
                    806:        if (opt == D_IFDEF && oldfile){
                    807:                long curpos = ftell(lb);
                    808:                /* print through if append (a>b), else to (nb: 0 vs 1 orig) */
                    809:                nc = f[a>b? b : a-1 ] - curpos;
                    810:                for (i = 0; i < nc; i++)
                    811:                        putchar(getc(lb));
                    812:        }
                    813:        if (a > b)
                    814:                return;
                    815:        if (opt == D_IFDEF) {
                    816:                if (inifdef)
                    817:                        fprintf(stdout, "#else %s%s\n", oneflag && oldfile==1 ? "!" : "", ifdef2);
                    818:                else {
                    819:                        if (oneflag) {
                    820:                                /* There was only one ifdef given */
                    821:                                endifname = ifdef2;
                    822:                                if (oldfile)
                    823:                                        fprintf(stdout, "#ifndef %s\n", endifname);
                    824:                                else
                    825:                                        fprintf(stdout, "#ifdef %s\n", endifname);
                    826:                        }
                    827:                        else {
                    828:                                endifname = oldfile ? ifdef1 : ifdef2;
                    829:                                fprintf(stdout, "#ifdef %s\n", endifname);
                    830:                        }
                    831:                }
                    832:                inifdef = 1+oldfile;
                    833:        }
                    834: 
                    835:        for(i=a;i<=b;i++) {
                    836:                fseek(lb,f[i-1],0);
                    837:                nc = f[i]-f[i-1];
                    838:                if (opt != D_IFDEF)
                    839:                        prints(s);
                    840:                col = 0;
                    841:                for(j=0;j<nc;j++) {
                    842:                        c = getc(lb);
                    843:                        if (c == '\t' && tflag)
                    844:                                do
                    845:                                        putchar(' ');
                    846:                                while (++col & 7);
                    847:                        else {
                    848:                                putchar(c);
                    849:                                col++;
                    850:                        }
                    851:                }
                    852:        }
                    853: 
                    854:        if (inifdef && !wantelses) {
                    855:                fprintf(stdout, "#endif %s\n", endifname);
                    856:                inifdef = 0;
                    857:        }
                    858: }
                    859: 
                    860: #define POW2                   /* define only if HALFLONG is 2**n */
                    861: #define HALFLONG 16
                    862: #define low(x) (x&((1L<<HALFLONG)-1))
                    863: #define high(x)        (x>>HALFLONG)
                    864: 
                    865: /*
                    866:  * hashing has the effect of
                    867:  * arranging line in 7-bit bytes and then
                    868:  * summing 1-s complement in 16-bit hunks 
                    869:  */
                    870: readhash(f)
                    871: register FILE *f;
                    872: {
                    873:        register long sum;
                    874:        register unsigned shift;
                    875:        register t;
                    876:        register space;
                    877: 
                    878:        sum = 1;
                    879:        space = 0;
                    880:        if(!bflag && !wflag) {
                    881:                if(iflag)
                    882:                        for(shift=0;(t=getc(f))!='\n';shift+=7) {
                    883:                                if(t==-1)
                    884:                                        return(0);
                    885:                                sum += (long)chrtran[t] << (shift
                    886: #ifdef POW2
                    887:                                    &= HALFLONG - 1);
                    888: #else
                    889:                                    %= HALFLONG);
                    890: #endif
                    891:                        }
                    892:                else
                    893:                        for(shift=0;(t=getc(f))!='\n';shift+=7) {
                    894:                                if(t==-1)
                    895:                                        return(0);
                    896:                                sum += (long)t << (shift
                    897: #ifdef POW2
                    898:                                    &= HALFLONG - 1);
                    899: #else
                    900:                                    %= HALFLONG);
                    901: #endif
                    902:                        }
                    903:        } else {
                    904:                for(shift=0;;) {
                    905:                        switch(t=getc(f)) {
                    906:                        case -1:
                    907:                                return(0);
                    908:                        case '\t':
                    909:                        case ' ':
                    910:                                space++;
                    911:                                continue;
                    912:                        default:
                    913:                                if(space && !wflag) {
                    914:                                        shift += 7;
                    915:                                        space = 0;
                    916:                                }
                    917:                                sum += (long)chrtran[t] << (shift
                    918: #ifdef POW2
                    919:                                    &= HALFLONG - 1);
                    920: #else
                    921:                                    %= HALFLONG);
                    922: #endif
                    923:                                shift += 7;
                    924:                                continue;
                    925:                        case '\n':
                    926:                                break;
                    927:                        }
                    928:                        break;
                    929:                }
                    930:        }
                    931:        sum = low(sum) + high(sum);
                    932:        return((short)low(sum) + (short)high(sum));
                    933: }
                    934: 
                    935: #include <a.out.h>
                    936: 
                    937: asciifile(f)
                    938:        FILE *f;
                    939: {
                    940:        char buf[BUFSIZ];
                    941:        register int cnt;
                    942:        register char *cp;
                    943: 
                    944:        fseek(f, (long)0, 0);
                    945:        cnt = fread(buf, 1, BUFSIZ, f);
                    946:        if (cnt >= sizeof (struct exec)) {
                    947:                struct exec hdr;
                    948:                hdr = *(struct exec *)buf;
                    949:                if (!N_BADMAG(hdr))
                    950:                        return (0);
                    951:        }
                    952:        cp = buf;
                    953:        while (--cnt >= 0)
                    954:                if (*cp++ & 0200)
                    955:                        return (0);
                    956:        return (1);
                    957: }
                    958: 
                    959: 
                    960: /* dump accumulated "context" diff changes */
                    961: dump_context_vec()
                    962: {
                    963:        register int    a, b, c, d;
                    964:        register char   ch;
                    965:        register struct context_vec *cvp = context_vec_start;
                    966:        register int    lowa, upb, lowc, upd;
                    967:        register int    do_output;
                    968: 
                    969:        if ( cvp > context_vec_ptr )
                    970:                return;
                    971: 
                    972:        lowa = max(1, cvp->a - context);
                    973:        upb  = min(len[0], context_vec_ptr->b + context);
                    974:        lowc = max(1, cvp->c - context);
                    975:        upd  = min(len[1], context_vec_ptr->d + context);
                    976: 
                    977:        printf("***************\n*** ");
                    978:        range(lowa,upb,",");
                    979:        printf(" ****\n");
                    980: 
                    981:        /*
                    982:         * output changes to the "old" file.  The first loop suppresses
                    983:         * output if there were no changes to the "old" file (we'll see
                    984:         * the "old" lines as context in the "new" list).
                    985:         */
                    986:        do_output = 0;
                    987:        for ( ; cvp <= context_vec_ptr; cvp++)
                    988:                if (cvp->a <= cvp->b) {
                    989:                        cvp = context_vec_start;
                    990:                        do_output++;
                    991:                        break;
                    992:                }
                    993:        
                    994:        if ( do_output ) {
                    995:                while (cvp <= context_vec_ptr) {
                    996:                        a = cvp->a; b = cvp->b; c = cvp->c; d = cvp->d;
                    997: 
                    998:                        if (a <= b && c <= d)
                    999:                                ch = 'c';
                   1000:                        else
                   1001:                                ch = (a <= b) ? 'd' : 'a';
                   1002: 
                   1003:                        if (ch == 'a')
                   1004:                                fetch(ixold,lowa,b,input[0],"  ");
                   1005:                        else {
                   1006:                                fetch(ixold,lowa,a-1,input[0],"  ");
                   1007:                                fetch(ixold,a,b,input[0],ch == 'c' ? "! " : "- ");
                   1008:                        }
                   1009:                        lowa = b + 1;
                   1010:                        cvp++;
                   1011:                }
                   1012:                fetch(ixold, b+1, upb, input[0], "  ");
                   1013:        }
                   1014: 
                   1015:        /* output changes to the "new" file */
                   1016:        printf("--- ");
                   1017:        range(lowc,upd,",");
                   1018:        printf(" ----\n");
                   1019: 
                   1020:        do_output = 0;
                   1021:        for (cvp = context_vec_start; cvp <= context_vec_ptr; cvp++)
                   1022:                if (cvp->c <= cvp->d) {
                   1023:                        cvp = context_vec_start;
                   1024:                        do_output++;
                   1025:                        break;
                   1026:                }
                   1027:        
                   1028:        if (do_output) {
                   1029:                while (cvp <= context_vec_ptr) {
                   1030:                        a = cvp->a; b = cvp->b; c = cvp->c; d = cvp->d;
                   1031: 
                   1032:                        if (a <= b && c <= d)
                   1033:                                ch = 'c';
                   1034:                        else
                   1035:                                ch = (a <= b) ? 'd' : 'a';
                   1036: 
                   1037:                        if (ch == 'd')
                   1038:                                fetch(ixnew,lowc,d,input[1],"  ");
                   1039:                        else {
                   1040:                                fetch(ixnew,lowc,c-1,input[1],"  ");
                   1041:                                fetch(ixnew,c,d,input[1],ch == 'c' ? "! " : "+ ");
                   1042:                        }
                   1043:                        lowc = d + 1;
                   1044:                        cvp++;
                   1045:                }
                   1046:                fetch(ixnew, d+1, upd, input[1], "  ");
                   1047:        }
                   1048: 
                   1049:        context_vec_ptr = context_vec_start - 1;
                   1050: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.