Annotation of 3BSD/cmd/egrep.y, revision 1.1

1.1     ! root        1: /*
        !             2:  * egrep -- print lines containing (or not containing) a regular expression
        !             3:  *
        !             4:  *     status returns:
        !             5:  *             0 - ok, and some matches
        !             6:  *             1 - ok, but no matches
        !             7:  *             2 - some error
        !             8:  */
        !             9: %token CHAR DOT CCL NCCL OR CAT STAR PLUS QUEST
        !            10: %left OR
        !            11: %left CHAR DOT CCL NCCL '('
        !            12: %left CAT
        !            13: %left STAR PLUS QUEST
        !            14: 
        !            15: %{
        !            16: #include <stdio.h>
        !            17: 
        !            18: #define MAXLIN 350
        !            19: #define MAXPOS 4000
        !            20: #define NCHARS 128
        !            21: #define NSTATES 128
        !            22: #define FINAL -1
        !            23: char gotofn[NSTATES][NCHARS];
        !            24: int state[NSTATES];
        !            25: char out[NSTATES];
        !            26: int line = 1;
        !            27: int name[MAXLIN];
        !            28: int left[MAXLIN];
        !            29: int right[MAXLIN];
        !            30: int parent[MAXLIN];
        !            31: int foll[MAXLIN];
        !            32: int positions[MAXPOS];
        !            33: char chars[MAXLIN];
        !            34: int nxtpos;
        !            35: int nxtchar = 0;
        !            36: int tmpstat[MAXLIN];
        !            37: int initstat[MAXLIN];
        !            38: int xstate;
        !            39: int count;
        !            40: int icount;
        !            41: char *input;
        !            42: 
        !            43: long   lnum;
        !            44: int    bflag;
        !            45: int    cflag;
        !            46: int    fflag;
        !            47: int    lflag;
        !            48: int    nflag;
        !            49: int    hflag   = 1;
        !            50: int    sflag;
        !            51: int    vflag;
        !            52: int    nfile;
        !            53: int    blkno;
        !            54: long   tln;
        !            55: int    nsucc;
        !            56: 
        !            57: int    f;
        !            58: int    fname;
        !            59: %}
        !            60: 
        !            61: %%
        !            62: s:     t
        !            63:                ={ unary(FINAL, $1);
        !            64:                  line--;
        !            65:                }
        !            66:        ;
        !            67: t:     b r
        !            68:                ={ $$ = node(CAT, $1, $2); }
        !            69:        | OR b r OR
        !            70:                ={ $$ = node(CAT, $2, $3); }
        !            71:        | OR b r
        !            72:                ={ $$ = node(CAT, $2, $3); }
        !            73:        | b r OR
        !            74:                ={ $$ = node(CAT, $1, $2); }
        !            75:        ;
        !            76: b:
        !            77:                ={ $$ = enter(DOT);
        !            78:                   $$ = unary(STAR, $$); }
        !            79:        ;
        !            80: r:     CHAR
        !            81:                ={ $$ = enter($1); }
        !            82:        | DOT
        !            83:                ={ $$ = enter(DOT); }
        !            84:        | CCL
        !            85:                ={ $$ = cclenter(CCL); }
        !            86:        | NCCL
        !            87:                ={ $$ = cclenter(NCCL); }
        !            88:        ;
        !            89: 
        !            90: r:     r OR r
        !            91:                ={ $$ = node(OR, $1, $3); }
        !            92:        | r r %prec CAT
        !            93:                ={ $$ = node(CAT, $1, $2); }
        !            94:        | r STAR
        !            95:                ={ $$ = unary(STAR, $1); }
        !            96:        | r PLUS
        !            97:                ={ $$ = unary(PLUS, $1); }
        !            98:        | r QUEST
        !            99:                ={ $$ = unary(QUEST, $1); }
        !           100:        | '(' r ')'
        !           101:                ={ $$ = $2; }
        !           102:        | error 
        !           103:        ;
        !           104: 
        !           105: %%
        !           106: yyerror(s) {
        !           107:        fprintf(stderr, "egrep: %s\n", s);
        !           108:        exit(2);
        !           109: }
        !           110: 
        !           111: yylex() {
        !           112:        extern int yylval;
        !           113:        int cclcnt, x;
        !           114:        register char c, d;
        !           115:        switch(c = nextch()) {
        !           116:                case '$':
        !           117:                case '^': c = '\n';
        !           118:                        goto defchar;
        !           119:                case '|': return (OR);
        !           120:                case '*': return (STAR);
        !           121:                case '+': return (PLUS);
        !           122:                case '?': return (QUEST);
        !           123:                case '(': return (c);
        !           124:                case ')': return (c);
        !           125:                case '.': return (DOT);
        !           126:                case '\0': return (0);
        !           127:                case '\n': return (OR);
        !           128:                case '[': 
        !           129:                        x = CCL;
        !           130:                        cclcnt = 0;
        !           131:                        count = nxtchar++;
        !           132:                        if ((c = nextch()) == '^') {
        !           133:                                x = NCCL;
        !           134:                                c = nextch();
        !           135:                        }
        !           136:                        do {
        !           137:                                if (c == '\0') synerror();
        !           138:                                if (c == '-' && cclcnt > 0 && chars[nxtchar-1] != 0) {
        !           139:                                        if ((d = nextch()) != 0) {
        !           140:                                                c = chars[nxtchar-1];
        !           141:                                                while (c < d) {
        !           142:                                                        if (nxtchar >= MAXLIN) overflo();
        !           143:                                                        chars[nxtchar++] = ++c;
        !           144:                                                        cclcnt++;
        !           145:                                                }
        !           146:                                                continue;
        !           147:                                        }
        !           148:                                }
        !           149:                                if (nxtchar >= MAXLIN) overflo();
        !           150:                                chars[nxtchar++] = c;
        !           151:                                cclcnt++;
        !           152:                        } while ((c = nextch()) != ']');
        !           153:                        chars[count] = cclcnt;
        !           154:                        return (x);
        !           155:                case '\\':
        !           156:                        if ((c = nextch()) == '\0') synerror();
        !           157:                defchar:
        !           158:                default: yylval = c; return (CHAR);
        !           159:        }
        !           160: }
        !           161: nextch() {
        !           162:        register char c;
        !           163:        if (fflag) {
        !           164:                if ((c = getc(stdin)) == EOF) return(0);
        !           165:        }
        !           166:        else c = *input++;
        !           167:        return(c);
        !           168: }
        !           169: 
        !           170: synerror() {
        !           171:        fprintf(stderr, "egrep: syntax error\n");
        !           172:        exit(2);
        !           173: }
        !           174: 
        !           175: enter(x) int x; {
        !           176:        if(line >= MAXLIN) overflo();
        !           177:        name[line] = x;
        !           178:        left[line] = 0;
        !           179:        right[line] = 0;
        !           180:        return(line++);
        !           181: }
        !           182: 
        !           183: cclenter(x) int x; {
        !           184:        register linno;
        !           185:        linno = enter(x);
        !           186:        right[linno] = count;
        !           187:        return (linno);
        !           188: }
        !           189: 
        !           190: node(x, l, r) {
        !           191:        if(line >= MAXLIN) overflo();
        !           192:        name[line] = x;
        !           193:        left[line] = l;
        !           194:        right[line] = r;
        !           195:        parent[l] = line;
        !           196:        parent[r] = line;
        !           197:        return(line++);
        !           198: }
        !           199: 
        !           200: unary(x, d) {
        !           201:        if(line >= MAXLIN) overflo();
        !           202:        name[line] = x;
        !           203:        left[line] = d;
        !           204:        right[line] = 0;
        !           205:        parent[d] = line;
        !           206:        return(line++);
        !           207: }
        !           208: overflo() {
        !           209:        fprintf(stderr, "egrep: regular expression too long\n");
        !           210:        exit(2);
        !           211: }
        !           212: 
        !           213: cfoll(v) {
        !           214:        register i;
        !           215:        if (left[v] == 0) {
        !           216:                count = 0;
        !           217:                for (i=1; i<=line; i++) tmpstat[i] = 0;
        !           218:                follow(v);
        !           219:                add(foll, v);
        !           220:        }
        !           221:        else if (right[v] == 0) cfoll(left[v]);
        !           222:        else {
        !           223:                cfoll(left[v]);
        !           224:                cfoll(right[v]);
        !           225:        }
        !           226: }
        !           227: cgotofn() {
        !           228:        register c, i, k;
        !           229:        int n, s;
        !           230:        char symbol[NCHARS];
        !           231:        int j, nc, pc, pos;
        !           232:        int curpos, num;
        !           233:        int number, newpos;
        !           234:        count = 0;
        !           235:        for (n=3; n<=line; n++) tmpstat[n] = 0;
        !           236:        if (cstate(line-1)==0) {
        !           237:                tmpstat[line] = 1;
        !           238:                count++;
        !           239:                out[0] = 1;
        !           240:        }
        !           241:        for (n=3; n<=line; n++) initstat[n] = tmpstat[n];
        !           242:        count--;                /*leave out position 1 */
        !           243:        icount = count;
        !           244:        tmpstat[1] = 0;
        !           245:        add(state, 0);
        !           246:        n = 0;
        !           247:        for (s=0; s<=n; s++)  {
        !           248:                if (out[s] == 1) continue;
        !           249:                for (i=0; i<NCHARS; i++) symbol[i] = 0;
        !           250:                num = positions[state[s]];
        !           251:                count = icount;
        !           252:                for (i=3; i<=line; i++) tmpstat[i] = initstat[i];
        !           253:                pos = state[s] + 1;
        !           254:                for (i=0; i<num; i++) {
        !           255:                        curpos = positions[pos];
        !           256:                        if ((c = name[curpos]) >= 0) {
        !           257:                                if (c < NCHARS) symbol[c] = 1;
        !           258:                                else if (c == DOT) {
        !           259:                                        for (k=0; k<NCHARS; k++)
        !           260:                                                if (k!='\n') symbol[k] = 1;
        !           261:                                }
        !           262:                                else if (c == CCL) {
        !           263:                                        nc = chars[right[curpos]];
        !           264:                                        pc = right[curpos] + 1;
        !           265:                                        for (k=0; k<nc; k++) symbol[chars[pc++]] = 1;
        !           266:                                }
        !           267:                                else if (c == NCCL) {
        !           268:                                        nc = chars[right[curpos]];
        !           269:                                        for (j = 0; j < NCHARS; j++) {
        !           270:                                                pc = right[curpos] + 1;
        !           271:                                                for (k = 0; k < nc; k++)
        !           272:                                                        if (j==chars[pc++]) goto cont;
        !           273:                                                if (j!='\n') symbol[j] = 1;
        !           274:                                                cont:;
        !           275:                                        }
        !           276:                                }
        !           277:                                else printf("something's funny\n");
        !           278:                        }
        !           279:                        pos++;
        !           280:                }
        !           281:                for (c=0; c<NCHARS; c++) {
        !           282:                        if (symbol[c] == 1) { /* nextstate(s,c) */
        !           283:                                count = icount;
        !           284:                                for (i=3; i <= line; i++) tmpstat[i] = initstat[i];
        !           285:                                pos = state[s] + 1;
        !           286:                                for (i=0; i<num; i++) {
        !           287:                                        curpos = positions[pos];
        !           288:                                        if ((k = name[curpos]) >= 0)
        !           289:                                                if (
        !           290:                                                        (k == c)
        !           291:                                                        | (k == DOT)
        !           292:                                                        | (k == CCL && member(c, right[curpos], 1))
        !           293:                                                        | (k == NCCL && member(c, right[curpos], 0))
        !           294:                                                ) {
        !           295:                                                        number = positions[foll[curpos]];
        !           296:                                                        newpos = foll[curpos] + 1;
        !           297:                                                        for (k=0; k<number; k++) {
        !           298:                                                                if (tmpstat[positions[newpos]] != 1) {
        !           299:                                                                        tmpstat[positions[newpos]] = 1;
        !           300:                                                                        count++;
        !           301:                                                                }
        !           302:                                                                newpos++;
        !           303:                                                        }
        !           304:                                                }
        !           305:                                        pos++;
        !           306:                                } /* end nextstate */
        !           307:                                if (notin(n)) {
        !           308:                                        if (n >= NSTATES) overflo();
        !           309:                                        add(state, ++n);
        !           310:                                        if (tmpstat[line] == 1) out[n] = 1;
        !           311:                                        gotofn[s][c] = n;
        !           312:                                }
        !           313:                                else {
        !           314:                                        gotofn[s][c] = xstate;
        !           315:                                }
        !           316:                        }
        !           317:                }
        !           318:        }
        !           319: }
        !           320: 
        !           321: cstate(v) {
        !           322:        register b;
        !           323:        if (left[v] == 0) {
        !           324:                if (tmpstat[v] != 1) {
        !           325:                        tmpstat[v] = 1;
        !           326:                        count++;
        !           327:                }
        !           328:                return(1);
        !           329:        }
        !           330:        else if (right[v] == 0) {
        !           331:                if (cstate(left[v]) == 0) return (0);
        !           332:                else if (name[v] == PLUS) return (1);
        !           333:                else return (0);
        !           334:        }
        !           335:        else if (name[v] == CAT) {
        !           336:                if (cstate(left[v]) == 0 && cstate(right[v]) == 0) return (0);
        !           337:                else return (1);
        !           338:        }
        !           339:        else { /* name[v] == OR */
        !           340:                b = cstate(right[v]);
        !           341:                if (cstate(left[v]) == 0 || b == 0) return (0);
        !           342:                else return (1);
        !           343:        }
        !           344: }
        !           345: 
        !           346: 
        !           347: member(symb, set, torf) {
        !           348:        register i, num, pos;
        !           349:        num = chars[set];
        !           350:        pos = set + 1;
        !           351:        for (i=0; i<num; i++)
        !           352:                if (symb == chars[pos++]) return (torf);
        !           353:        return (!torf);
        !           354: }
        !           355: 
        !           356: notin(n) {
        !           357:        register i, j, pos;
        !           358:        for (i=0; i<=n; i++) {
        !           359:                if (positions[state[i]] == count) {
        !           360:                        pos = state[i] + 1;
        !           361:                        for (j=0; j < count; j++)
        !           362:                                if (tmpstat[positions[pos++]] != 1) goto nxt;
        !           363:                        xstate = i;
        !           364:                        return (0);
        !           365:                }
        !           366:                nxt: ;
        !           367:        }
        !           368:        return (1);
        !           369: }
        !           370: 
        !           371: add(array, n) int *array; {
        !           372:        register i;
        !           373:        if (nxtpos + count > MAXPOS) overflo();
        !           374:        array[n] = nxtpos;
        !           375:        positions[nxtpos++] = count;
        !           376:        for (i=3; i <= line; i++) {
        !           377:                if (tmpstat[i] == 1) {
        !           378:                        positions[nxtpos++] = i;
        !           379:                }
        !           380:        }
        !           381: }
        !           382: 
        !           383: follow(v) int v; {
        !           384:        int p;
        !           385:        if (v == line) return;
        !           386:        p = parent[v];
        !           387:        switch(name[p]) {
        !           388:                case STAR:
        !           389:                case PLUS:      cstate(v);
        !           390:                                follow(p);
        !           391:                                return;
        !           392: 
        !           393:                case OR:
        !           394:                case QUEST:     follow(p);
        !           395:                                return;
        !           396: 
        !           397:                case CAT:       if (v == left[p]) {
        !           398:                                        if (cstate(right[p]) == 0) {
        !           399:                                                follow(p);
        !           400:                                                return;
        !           401:                                        }
        !           402:                                }
        !           403:                                else follow(p);
        !           404:                                return;
        !           405:                case FINAL:     if (tmpstat[line] != 1) {
        !           406:                                        tmpstat[line] = 1;
        !           407:                                        count++;
        !           408:                                }
        !           409:                                return;
        !           410:        }
        !           411: }
        !           412: 
        !           413: 
        !           414: main(argc, argv)
        !           415: char **argv;
        !           416: {
        !           417:        while (--argc > 0 && (++argv)[0][0]=='-')
        !           418:                switch (argv[0][1]) {
        !           419: 
        !           420:                case 's':
        !           421:                        sflag++;
        !           422:                        continue;
        !           423: 
        !           424:                case 'h':
        !           425:                        hflag = 0;
        !           426:                        continue;
        !           427: 
        !           428:                case 'b':
        !           429:                        bflag++;
        !           430:                        continue;
        !           431: 
        !           432:                case 'c':
        !           433:                        cflag++;
        !           434:                        continue;
        !           435: 
        !           436:                case 'e':
        !           437:                        argc--;
        !           438:                        argv++;
        !           439:                        goto out;
        !           440: 
        !           441:                case 'f':
        !           442:                        fflag++;
        !           443:                        continue;
        !           444: 
        !           445:                case 'l':
        !           446:                        lflag++;
        !           447:                        continue;
        !           448: 
        !           449:                case 'n':
        !           450:                        nflag++;
        !           451:                        continue;
        !           452: 
        !           453:                case 'v':
        !           454:                        vflag++;
        !           455:                        continue;
        !           456: 
        !           457:                default:
        !           458:                        fprintf(stderr, "egrep: unknown flag\n");
        !           459:                        continue;
        !           460:                }
        !           461: out:
        !           462:        if (argc<=0)
        !           463:                exit(2);
        !           464:        if (fflag) {
        !           465:                if (freopen(fname = *argv, "r", stdin) == NULL) {
        !           466:                        fprintf(stderr, "egrep: can't open %s\n", fname);
        !           467:                        exit(2);
        !           468:                }
        !           469:        }
        !           470:        else input = *argv;
        !           471:        argc--;
        !           472:        argv++;
        !           473: 
        !           474:        yyparse();
        !           475: 
        !           476:        cfoll(line-1);
        !           477:        cgotofn();
        !           478:        nfile = argc;
        !           479:        if (argc<=0) {
        !           480:                if (lflag) exit(1);
        !           481:                execute(0);
        !           482:        }
        !           483:        else while (--argc >= 0) {
        !           484:                execute(*argv);
        !           485:                argv++;
        !           486:        }
        !           487:        exit(nsucc == 0);
        !           488: }
        !           489: 
        !           490: execute(file)
        !           491: char *file;
        !           492: {
        !           493:        register char *p;
        !           494:        register cstat;
        !           495:        register ccount;
        !           496:        char buf[1024];
        !           497:        char *nlp;
        !           498:        int istat;
        !           499:        if (file) {
        !           500:                if ((f = open(file, 0)) < 0) {
        !           501:                        fprintf(stderr, "egrep: can't open %s\n", file);
        !           502:                        exit(2);
        !           503:                }
        !           504:        }
        !           505:        else f = 0;
        !           506:        ccount = 0;
        !           507:        lnum = 1;
        !           508:        tln = 0;
        !           509:        blkno = 0;
        !           510:        p = buf;
        !           511:        nlp = p;
        !           512:        if ((ccount = read(f,p,512))<=0) goto done;
        !           513:        istat = cstat = gotofn[0]['\n'];
        !           514:        if (out[cstat]) goto found;
        !           515:        for (;;) {
        !           516:                cstat = gotofn[cstat][*p&0377]; /* all input chars made positive */
        !           517:                if (out[cstat]) {
        !           518:                found:  for(;;) {
        !           519:                                if (*p++ == '\n') {
        !           520:                                        if (vflag == 0) {
        !           521:                                succeed:        nsucc = 1;
        !           522:                                                if (cflag) tln++;
        !           523:                                                else if (sflag)
        !           524:                                                        ;       /* ugh */
        !           525:                                                else if (lflag) {
        !           526:                                                        printf("%s\n", file);
        !           527:                                                        close(f);
        !           528:                                                        return;
        !           529:                                                }
        !           530:                                                else {
        !           531:                                                        if (nfile > 1 && hflag) printf("%s:", file);
        !           532:                                                        if (bflag) printf("%d:", blkno);
        !           533:                                                        if (nflag) printf("%ld:", lnum);
        !           534:                                                        if (p <= nlp) {
        !           535:                                                                while (nlp < &buf[1024]) putchar(*nlp++);
        !           536:                                                                nlp = buf;
        !           537:                                                        }
        !           538:                                                        while (nlp < p) putchar(*nlp++);
        !           539:                                                }
        !           540:                                        }
        !           541:                                        lnum++;
        !           542:                                        nlp = p;
        !           543:                                        if ((out[(cstat=istat)]) == 0) goto brk2;
        !           544:                                }
        !           545:                                cfound:
        !           546:                                if (--ccount <= 0) {
        !           547:                                        if (p <= &buf[512]) {
        !           548:                                                if ((ccount = read(f, p, 512)) <= 0) goto done;
        !           549:                                        }
        !           550:                                        else if (p == &buf[1024]) {
        !           551:                                                p = buf;
        !           552:                                                if ((ccount = read(f, p, 512)) <= 0) goto done;
        !           553:                                        }
        !           554:                                        else {
        !           555:                                                if ((ccount = read(f, p, &buf[1024]-p)) <= 0) goto done;
        !           556:                                        }
        !           557:                                        blkno++;
        !           558:                                }
        !           559:                        }
        !           560:                }
        !           561:                if (*p++ == '\n') {
        !           562:                        if (vflag) goto succeed;
        !           563:                        else {
        !           564:                                lnum++;
        !           565:                                nlp = p;
        !           566:                                if (out[(cstat=istat)]) goto cfound;
        !           567:                        }
        !           568:                }
        !           569:                brk2:
        !           570:                if (--ccount <= 0) {
        !           571:                        if (p <= &buf[512]) {
        !           572:                                if ((ccount = read(f, p, 512)) <= 0) break;
        !           573:                        }
        !           574:                        else if (p == &buf[1024]) {
        !           575:                                p = buf;
        !           576:                                if ((ccount = read(f, p, 512)) <= 0) break;
        !           577:                        }
        !           578:                        else {
        !           579:                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
        !           580:                        }
        !           581:                        blkno++;
        !           582:                }
        !           583:        }
        !           584: done:  close(f);
        !           585:        if (cflag) {
        !           586:                if (nfile > 1)
        !           587:                        printf("%s:", file);
        !           588:                printf("%ld\n", tln);
        !           589:        }
        !           590: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.