Annotation of 43BSD/usr.bin/egrep.y, revision 1.1.1.1

1.1       root        1: /*
                      2:  * egrep -- print lines containing (or not containing) a regular expression
                      3:  *
                      4:  *     status returns:
                      5:  *             0 - ok, and some matches
                      6:  *             1 - ok, but no matches
                      7:  *             2 - some error
                      8:  */
                      9: %token CHAR DOT CCL NCCL OR CAT STAR PLUS QUEST
                     10: %left OR
                     11: %left CHAR DOT CCL NCCL '('
                     12: %left CAT
                     13: %left STAR PLUS QUEST
                     14: 
                     15: %{
                     16: static char *sccsid = "@(#)egrep.y     4.4 (Berkeley) 5/29/85";
                     17: #include <stdio.h>
                     18: #include <sys/types.h>
                     19: #include <sys/stat.h>
                     20: 
                     21: #define BLKSIZE 8192
                     22: #define MAXLIN 350
                     23: #define MAXPOS 4000
                     24: #define NCHARS 128
                     25: #define NSTATES 128
                     26: #define FINAL -1
                     27: char gotofn[NSTATES][NCHARS];
                     28: int state[NSTATES];
                     29: char out[NSTATES];
                     30: int line = 1;
                     31: int name[MAXLIN];
                     32: int left[MAXLIN];
                     33: int right[MAXLIN];
                     34: int parent[MAXLIN];
                     35: int foll[MAXLIN];
                     36: int positions[MAXPOS];
                     37: char chars[MAXLIN];
                     38: int nxtpos;
                     39: int nxtchar = 0;
                     40: int tmpstat[MAXLIN];
                     41: int initstat[MAXLIN];
                     42: int xstate;
                     43: int count;
                     44: int icount;
                     45: char *input;
                     46: FILE *exprfile;
                     47: 
                     48: long   lnum;
                     49: int    bflag;
                     50: int    cflag;
                     51: int    fflag;
                     52: int    lflag;
                     53: int    nflag;
                     54: int    hflag   = 1;
                     55: int    sflag;
                     56: int    vflag;
                     57: int    retcode = 0;
                     58: int    nfile;
                     59: int    blkno;
                     60: long   tln;
                     61: int    nsucc;
                     62: 
                     63: int    f;
                     64: char   *fname;
                     65: %}
                     66: 
                     67: %%
                     68: s:     t
                     69:                ={ unary(FINAL, $1);
                     70:                  line--;
                     71:                }
                     72:        ;
                     73: t:     b r
                     74:                ={ $$ = node(CAT, $1, $2); }
                     75:        | OR b r OR
                     76:                ={ $$ = node(CAT, $2, $3); }
                     77:        | OR b r
                     78:                ={ $$ = node(CAT, $2, $3); }
                     79:        | b r OR
                     80:                ={ $$ = node(CAT, $1, $2); }
                     81:        ;
                     82: b:
                     83:                ={ $$ = enter(DOT);
                     84:                   $$ = unary(STAR, $$); }
                     85:        ;
                     86: r:     CHAR
                     87:                ={ $$ = enter($1); }
                     88:        | DOT
                     89:                ={ $$ = enter(DOT); }
                     90:        | CCL
                     91:                ={ $$ = cclenter(CCL); }
                     92:        | NCCL
                     93:                ={ $$ = cclenter(NCCL); }
                     94:        ;
                     95: 
                     96: r:     r OR r
                     97:                ={ $$ = node(OR, $1, $3); }
                     98:        | r r %prec CAT
                     99:                ={ $$ = node(CAT, $1, $2); }
                    100:        | r STAR
                    101:                ={ $$ = unary(STAR, $1); }
                    102:        | r PLUS
                    103:                ={ $$ = unary(PLUS, $1); }
                    104:        | r QUEST
                    105:                ={ $$ = unary(QUEST, $1); }
                    106:        | '(' r ')'
                    107:                ={ $$ = $2; }
                    108:        | error 
                    109:        ;
                    110: 
                    111: %%
                    112: yyerror(s) {
                    113:        fprintf(stderr, "egrep: %s\n", s);
                    114:        exit(2);
                    115: }
                    116: 
                    117: yylex() {
                    118:        extern int yylval;
                    119:        int cclcnt, x;
                    120:        register char c, d;
                    121:        switch(c = nextch()) {
                    122:                case '$':
                    123:                case '^': c = '\n';
                    124:                        goto defchar;
                    125:                case '|': return (OR);
                    126:                case '*': return (STAR);
                    127:                case '+': return (PLUS);
                    128:                case '?': return (QUEST);
                    129:                case '(': return (c);
                    130:                case ')': return (c);
                    131:                case '.': return (DOT);
                    132:                case '\0': return (0);
                    133:                case '\n': return (OR);
                    134:                case '[': 
                    135:                        x = CCL;
                    136:                        cclcnt = 0;
                    137:                        count = nxtchar++;
                    138:                        if ((c = nextch()) == '^') {
                    139:                                x = NCCL;
                    140:                                c = nextch();
                    141:                        }
                    142:                        do {
                    143:                                if (c == '\0') synerror();
                    144:                                if (c == '-' && cclcnt > 0 && chars[nxtchar-1] != 0) {
                    145:                                        if ((d = nextch()) != 0) {
                    146:                                                c = chars[nxtchar-1];
                    147:                                                while (c < d) {
                    148:                                                        if (nxtchar >= MAXLIN) overflo();
                    149:                                                        chars[nxtchar++] = ++c;
                    150:                                                        cclcnt++;
                    151:                                                }
                    152:                                                continue;
                    153:                                        }
                    154:                                }
                    155:                                if (nxtchar >= MAXLIN) overflo();
                    156:                                chars[nxtchar++] = c;
                    157:                                cclcnt++;
                    158:                        } while ((c = nextch()) != ']');
                    159:                        chars[count] = cclcnt;
                    160:                        return (x);
                    161:                case '\\':
                    162:                        if ((c = nextch()) == '\0') synerror();
                    163:                defchar:
                    164:                default: yylval = c; return (CHAR);
                    165:        }
                    166: }
                    167: nextch() {
                    168:        register char c;
                    169:        if (fflag) {
                    170:                if ((c = getc(exprfile)) == EOF) {
                    171:                        fclose(exprfile);
                    172:                        return(0);
                    173:                }
                    174:        }
                    175:        else c = *input++;
                    176:        return(c);
                    177: }
                    178: 
                    179: synerror() {
                    180:        fprintf(stderr, "egrep: syntax error\n");
                    181:        exit(2);
                    182: }
                    183: 
                    184: enter(x) int x; {
                    185:        if(line >= MAXLIN) overflo();
                    186:        name[line] = x;
                    187:        left[line] = 0;
                    188:        right[line] = 0;
                    189:        return(line++);
                    190: }
                    191: 
                    192: cclenter(x) int x; {
                    193:        register linno;
                    194:        linno = enter(x);
                    195:        right[linno] = count;
                    196:        return (linno);
                    197: }
                    198: 
                    199: node(x, l, r) {
                    200:        if(line >= MAXLIN) overflo();
                    201:        name[line] = x;
                    202:        left[line] = l;
                    203:        right[line] = r;
                    204:        parent[l] = line;
                    205:        parent[r] = line;
                    206:        return(line++);
                    207: }
                    208: 
                    209: unary(x, d) {
                    210:        if(line >= MAXLIN) overflo();
                    211:        name[line] = x;
                    212:        left[line] = d;
                    213:        right[line] = 0;
                    214:        parent[d] = line;
                    215:        return(line++);
                    216: }
                    217: overflo() {
                    218:        fprintf(stderr, "egrep: regular expression too long\n");
                    219:        exit(2);
                    220: }
                    221: 
                    222: cfoll(v) {
                    223:        register i;
                    224:        if (left[v] == 0) {
                    225:                count = 0;
                    226:                for (i=1; i<=line; i++) tmpstat[i] = 0;
                    227:                follow(v);
                    228:                add(foll, v);
                    229:        }
                    230:        else if (right[v] == 0) cfoll(left[v]);
                    231:        else {
                    232:                cfoll(left[v]);
                    233:                cfoll(right[v]);
                    234:        }
                    235: }
                    236: cgotofn() {
                    237:        register c, i, k;
                    238:        int n, s;
                    239:        char symbol[NCHARS];
                    240:        int j, nc, pc, pos;
                    241:        int curpos, num;
                    242:        int number, newpos;
                    243:        count = 0;
                    244:        for (n=3; n<=line; n++) tmpstat[n] = 0;
                    245:        if (cstate(line-1)==0) {
                    246:                tmpstat[line] = 1;
                    247:                count++;
                    248:                out[0] = 1;
                    249:        }
                    250:        for (n=3; n<=line; n++) initstat[n] = tmpstat[n];
                    251:        count--;                /*leave out position 1 */
                    252:        icount = count;
                    253:        tmpstat[1] = 0;
                    254:        add(state, 0);
                    255:        n = 0;
                    256:        for (s=0; s<=n; s++)  {
                    257:                if (out[s] == 1) continue;
                    258:                for (i=0; i<NCHARS; i++) symbol[i] = 0;
                    259:                num = positions[state[s]];
                    260:                count = icount;
                    261:                for (i=3; i<=line; i++) tmpstat[i] = initstat[i];
                    262:                pos = state[s] + 1;
                    263:                for (i=0; i<num; i++) {
                    264:                        curpos = positions[pos];
                    265:                        if ((c = name[curpos]) >= 0) {
                    266:                                if (c < NCHARS) symbol[c] = 1;
                    267:                                else if (c == DOT) {
                    268:                                        for (k=0; k<NCHARS; k++)
                    269:                                                if (k!='\n') symbol[k] = 1;
                    270:                                }
                    271:                                else if (c == CCL) {
                    272:                                        nc = chars[right[curpos]];
                    273:                                        pc = right[curpos] + 1;
                    274:                                        for (k=0; k<nc; k++) symbol[chars[pc++]] = 1;
                    275:                                }
                    276:                                else if (c == NCCL) {
                    277:                                        nc = chars[right[curpos]];
                    278:                                        for (j = 0; j < NCHARS; j++) {
                    279:                                                pc = right[curpos] + 1;
                    280:                                                for (k = 0; k < nc; k++)
                    281:                                                        if (j==chars[pc++]) goto cont;
                    282:                                                if (j!='\n') symbol[j] = 1;
                    283:                                                cont:;
                    284:                                        }
                    285:                                }
                    286:                                else printf("something's funny\n");
                    287:                        }
                    288:                        pos++;
                    289:                }
                    290:                for (c=0; c<NCHARS; c++) {
                    291:                        if (symbol[c] == 1) { /* nextstate(s,c) */
                    292:                                count = icount;
                    293:                                for (i=3; i <= line; i++) tmpstat[i] = initstat[i];
                    294:                                pos = state[s] + 1;
                    295:                                for (i=0; i<num; i++) {
                    296:                                        curpos = positions[pos];
                    297:                                        if ((k = name[curpos]) >= 0)
                    298:                                                if (
                    299:                                                        (k == c)
                    300:                                                        | (k == DOT)
                    301:                                                        | (k == CCL && member(c, right[curpos], 1))
                    302:                                                        | (k == NCCL && member(c, right[curpos], 0))
                    303:                                                ) {
                    304:                                                        number = positions[foll[curpos]];
                    305:                                                        newpos = foll[curpos] + 1;
                    306:                                                        for (k=0; k<number; k++) {
                    307:                                                                if (tmpstat[positions[newpos]] != 1) {
                    308:                                                                        tmpstat[positions[newpos]] = 1;
                    309:                                                                        count++;
                    310:                                                                }
                    311:                                                                newpos++;
                    312:                                                        }
                    313:                                                }
                    314:                                        pos++;
                    315:                                } /* end nextstate */
                    316:                                if (notin(n)) {
                    317:                                        if (n >= NSTATES) overflo();
                    318:                                        add(state, ++n);
                    319:                                        if (tmpstat[line] == 1) out[n] = 1;
                    320:                                        gotofn[s][c] = n;
                    321:                                }
                    322:                                else {
                    323:                                        gotofn[s][c] = xstate;
                    324:                                }
                    325:                        }
                    326:                }
                    327:        }
                    328: }
                    329: 
                    330: cstate(v) {
                    331:        register b;
                    332:        if (left[v] == 0) {
                    333:                if (tmpstat[v] != 1) {
                    334:                        tmpstat[v] = 1;
                    335:                        count++;
                    336:                }
                    337:                return(1);
                    338:        }
                    339:        else if (right[v] == 0) {
                    340:                if (cstate(left[v]) == 0) return (0);
                    341:                else if (name[v] == PLUS) return (1);
                    342:                else return (0);
                    343:        }
                    344:        else if (name[v] == CAT) {
                    345:                if (cstate(left[v]) == 0 && cstate(right[v]) == 0) return (0);
                    346:                else return (1);
                    347:        }
                    348:        else { /* name[v] == OR */
                    349:                b = cstate(right[v]);
                    350:                if (cstate(left[v]) == 0 || b == 0) return (0);
                    351:                else return (1);
                    352:        }
                    353: }
                    354: 
                    355: 
                    356: member(symb, set, torf) {
                    357:        register i, num, pos;
                    358:        num = chars[set];
                    359:        pos = set + 1;
                    360:        for (i=0; i<num; i++)
                    361:                if (symb == chars[pos++]) return (torf);
                    362:        return (!torf);
                    363: }
                    364: 
                    365: notin(n) {
                    366:        register i, j, pos;
                    367:        for (i=0; i<=n; i++) {
                    368:                if (positions[state[i]] == count) {
                    369:                        pos = state[i] + 1;
                    370:                        for (j=0; j < count; j++)
                    371:                                if (tmpstat[positions[pos++]] != 1) goto nxt;
                    372:                        xstate = i;
                    373:                        return (0);
                    374:                }
                    375:                nxt: ;
                    376:        }
                    377:        return (1);
                    378: }
                    379: 
                    380: add(array, n) int *array; {
                    381:        register i;
                    382:        if (nxtpos + count > MAXPOS) overflo();
                    383:        array[n] = nxtpos;
                    384:        positions[nxtpos++] = count;
                    385:        for (i=3; i <= line; i++) {
                    386:                if (tmpstat[i] == 1) {
                    387:                        positions[nxtpos++] = i;
                    388:                }
                    389:        }
                    390: }
                    391: 
                    392: follow(v) int v; {
                    393:        int p;
                    394:        if (v == line) return;
                    395:        p = parent[v];
                    396:        switch(name[p]) {
                    397:                case STAR:
                    398:                case PLUS:      cstate(v);
                    399:                                follow(p);
                    400:                                return;
                    401: 
                    402:                case OR:
                    403:                case QUEST:     follow(p);
                    404:                                return;
                    405: 
                    406:                case CAT:       if (v == left[p]) {
                    407:                                        if (cstate(right[p]) == 0) {
                    408:                                                follow(p);
                    409:                                                return;
                    410:                                        }
                    411:                                }
                    412:                                else follow(p);
                    413:                                return;
                    414:                case FINAL:     if (tmpstat[line] != 1) {
                    415:                                        tmpstat[line] = 1;
                    416:                                        count++;
                    417:                                }
                    418:                                return;
                    419:        }
                    420: }
                    421: 
                    422: 
                    423: main(argc, argv)
                    424: char **argv;
                    425: {
                    426:        while (--argc > 0 && (++argv)[0][0]=='-')
                    427:                switch (argv[0][1]) {
                    428: 
                    429:                case 's':
                    430:                        sflag++;
                    431:                        continue;
                    432: 
                    433:                case 'h':
                    434:                        hflag = 0;
                    435:                        continue;
                    436: 
                    437:                case 'b':
                    438:                        bflag++;
                    439:                        continue;
                    440: 
                    441:                case 'c':
                    442:                        cflag++;
                    443:                        continue;
                    444: 
                    445:                case 'e':
                    446:                        argc--;
                    447:                        argv++;
                    448:                        goto out;
                    449: 
                    450:                case 'f':
                    451:                        fflag++;
                    452:                        continue;
                    453: 
                    454:                case 'l':
                    455:                        lflag++;
                    456:                        continue;
                    457: 
                    458:                case 'n':
                    459:                        nflag++;
                    460:                        continue;
                    461: 
                    462:                case 'v':
                    463:                        vflag++;
                    464:                        continue;
                    465: 
                    466:                default:
                    467:                        fprintf(stderr, "egrep: unknown flag\n");
                    468:                        continue;
                    469:                }
                    470: out:
                    471:        if (argc<=0)
                    472:                exit(2);
                    473:        if (fflag) {
                    474:                fname = *argv;
                    475:                exprfile = fopen(fname, "r");
                    476:                if (exprfile == (FILE *)NULL) {
                    477:                        fprintf(stderr, "egrep: can't open %s\n", fname);
                    478:                        exit(2);
                    479:                }
                    480:        }
                    481:        else input = *argv;
                    482:        argc--;
                    483:        argv++;
                    484: 
                    485:        yyparse();
                    486: 
                    487:        cfoll(line-1);
                    488:        cgotofn();
                    489:        nfile = argc;
                    490:        if (argc<=0) {
                    491:                if (lflag) exit(1);
                    492:                execute(0);
                    493:        }
                    494:        else while (--argc >= 0) {
                    495:                execute(*argv);
                    496:                argv++;
                    497:        }
                    498:        exit(retcode != 0 ? retcode : nsucc == 0);
                    499: }
                    500: 
                    501: execute(file)
                    502: char *file;
                    503: {
                    504:        register char *p;
                    505:        register cstat;
                    506:        register ccount;
                    507:        static char *buf;
                    508:        static int blksize;
                    509:        struct stat stb;
                    510:        char *nlp;
                    511:        int istat;
                    512:        if (file) {
                    513:                if ((f = open(file, 0)) < 0) {
                    514:                        fprintf(stderr, "egrep: can't open %s\n", file);
                    515:                        retcode = 2;
                    516:                        return;
                    517:                }
                    518:        }
                    519:        else f = 0;
                    520:        if (buf == NULL) {
                    521:                if (fstat(f, &stb) > 0 && stb.st_blksize > 0)
                    522:                        blksize = stb.st_blksize;
                    523:                else
                    524:                        blksize = BLKSIZE;
                    525:                buf = (char *)malloc(2*blksize);
                    526:                if (buf == NULL) {
                    527:                        fprintf(stderr, "egrep: no memory for %s\n", file);
                    528:                        retcode = 2;
                    529:                        return;
                    530:                }
                    531:        }
                    532:        ccount = 0;
                    533:        lnum = 1;
                    534:        tln = 0;
                    535:        blkno = 0;
                    536:        p = buf;
                    537:        nlp = p;
                    538:        if ((ccount = read(f,p,blksize))<=0) goto done;
                    539:        istat = cstat = gotofn[0]['\n'];
                    540:        if (out[cstat]) goto found;
                    541:        for (;;) {
                    542:                cstat = gotofn[cstat][*p&0377]; /* all input chars made positive */
                    543:                if (out[cstat]) {
                    544:                found:  for(;;) {
                    545:                                if (*p++ == '\n') {
                    546:                                        if (vflag == 0) {
                    547:                                succeed:        nsucc = 1;
                    548:                                                if (cflag) tln++;
                    549:                                                else if (sflag)
                    550:                                                        ;       /* ugh */
                    551:                                                else if (lflag) {
                    552:                                                        printf("%s\n", file);
                    553:                                                        close(f);
                    554:                                                        return;
                    555:                                                }
                    556:                                                else {
                    557:                                                        if (nfile > 1 && hflag) printf("%s:", file);
                    558:                                                        if (bflag) printf("%d:", blkno);
                    559:                                                        if (nflag) printf("%ld:", lnum);
                    560:                                                        if (p <= nlp) {
                    561:                                                                while (nlp < &buf[2*blksize]) putchar(*nlp++);
                    562:                                                                nlp = buf;
                    563:                                                        }
                    564:                                                        while (nlp < p) putchar(*nlp++);
                    565:                                                }
                    566:                                        }
                    567:                                        lnum++;
                    568:                                        nlp = p;
                    569:                                        if ((out[(cstat=istat)]) == 0) goto brk2;
                    570:                                }
                    571:                                cfound:
                    572:                                if (--ccount <= 0) {
                    573:                                        if (p <= &buf[blksize]) {
                    574:                                                if ((ccount = read(f, p, blksize)) <= 0) goto done;
                    575:                                        }
                    576:                                        else if (p == &buf[2*blksize]) {
                    577:                                                p = buf;
                    578:                                                if ((ccount = read(f, p, blksize)) <= 0) goto done;
                    579:                                        }
                    580:                                        else {
                    581:                                                if ((ccount = read(f, p, &buf[2*blksize]-p)) <= 0) goto done;
                    582:                                        }
                    583:                                        blkno += ccount / 512;
                    584:                                }
                    585:                        }
                    586:                }
                    587:                if (*p++ == '\n') {
                    588:                        if (vflag) goto succeed;
                    589:                        else {
                    590:                                lnum++;
                    591:                                nlp = p;
                    592:                                if (out[(cstat=istat)]) goto cfound;
                    593:                        }
                    594:                }
                    595:                brk2:
                    596:                if (--ccount <= 0) {
                    597:                        if (p <= &buf[blksize]) {
                    598:                                if ((ccount = read(f, p, blksize)) <= 0) break;
                    599:                        }
                    600:                        else if (p == &buf[2*blksize]) {
                    601:                                p = buf;
                    602:                                if ((ccount = read(f, p, blksize)) <= 0) break;
                    603:                        }
                    604:                        else {
                    605:                                if ((ccount = read(f, p, &buf[2*blksize] - p)) <= 0) break;
                    606:                        }
                    607:                        blkno += ccount / 512;
                    608:                }
                    609:        }
                    610: done:  close(f);
                    611:        if (cflag) {
                    612:                if (nfile > 1)
                    613:                        printf("%s:", file);
                    614:                printf("%ld\n", tln);
                    615:        }
                    616: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.