Annotation of 43BSD/ucb/grep.c, revision 1.1

1.1     ! root        1: /*
        !             2:  * Copyright (c) 1980 Regents of the University of California.
        !             3:  * All rights reserved.  The Berkeley software License Agreement
        !             4:  * specifies the terms and conditions for redistribution.
        !             5:  */
        !             6: 
        !             7: #ifndef lint
        !             8: char copyright[] =
        !             9: "@(#) Copyright (c) 1980 Regents of the University of California.\n\
        !            10:  All rights reserved.\n";
        !            11: #endif not lint
        !            12: 
        !            13: #ifndef lint
        !            14: static char sccsid[] = "@(#)grep.c     5.2 (Berkeley) 3/4/86";
        !            15: #endif not lint
        !            16: 
        !            17: #include <stdio.h>
        !            18: #include <sys/types.h>
        !            19: #include <sys/stat.h>
        !            20: /*
        !            21:  * grep -- print lines matching (or not matching) a pattern
        !            22:  */
        !            23: 
        !            24: #define BLKSIZE 8192
        !            25: #define        CCHR    2
        !            26: #define        CDOT    4
        !            27: #define        CCL     6
        !            28: #define        NCCL    8
        !            29: #define        CDOL    10
        !            30: #define        CEOF    11
        !            31: 
        !            32: #define        CBRC    14
        !            33: #define        CLET    15
        !            34: #define        STAR    01
        !            35: 
        !            36: #define        ESIZE   256
        !            37: 
        !            38: char   expbuf[ESIZE];
        !            39: long   lnum;
        !            40: char   linebuf[BUFSIZ+1];
        !            41: int    bflag;
        !            42: int    nflag;
        !            43: int    cflag;
        !            44: int    vflag;
        !            45: int    nfile;
        !            46: int    iflag;
        !            47: int    lflag;
        !            48: int    wflag;
        !            49: int    sflag;
        !            50: int    nsucc;
        !            51: int    circf;
        !            52: int    blkno;
        !            53: long   tln;
        !            54: int    retcode = 0;
        !            55: 
        !            56: main(argc, argv)
        !            57: char **argv;
        !            58: {
        !            59: 
        !            60:        while (--argc > 0 && (++argv)[0][0]=='-') {
        !            61:                char *cp = argv[0] + 1;
        !            62:                while (*cp) switch (*cp++) {
        !            63: 
        !            64:                case 'v':
        !            65:                        vflag++;
        !            66:                        continue;
        !            67: 
        !            68:                case 'b':
        !            69:                        bflag++;
        !            70:                        continue;
        !            71: 
        !            72:                case 'i':
        !            73:                case 'y':       /* -y for compatibility with btl grep */
        !            74:                        iflag++;
        !            75:                        continue;
        !            76: 
        !            77:                case 'l':
        !            78:                        lflag++;
        !            79:                case 'c':
        !            80:                        cflag++;
        !            81:                        continue;
        !            82: 
        !            83:                case 'w':
        !            84:                        wflag++;
        !            85:                        continue;
        !            86: 
        !            87:                case 's':
        !            88:                        sflag++;
        !            89:                        continue;
        !            90: 
        !            91:                case 'n':
        !            92:                        nflag++;
        !            93:                        continue;
        !            94: 
        !            95:                case 'e':
        !            96:                        --argc;
        !            97:                        ++argv;
        !            98:                        goto out;
        !            99: 
        !           100:                default:
        !           101:                        fprintf(stderr, "grep: unknown flag\n");
        !           102:                        continue;
        !           103:                }
        !           104:        }
        !           105: out:
        !           106:        if (argc<=0)
        !           107:                exit(2);
        !           108:        compile(*argv);
        !           109:        nfile = --argc;
        !           110:        if (argc<=0) {
        !           111:                if (lflag)
        !           112:                        exit(1);
        !           113:                execute(0);
        !           114:        }
        !           115:        else while (--argc >= 0) {
        !           116:                argv++;
        !           117:                execute(*argv);
        !           118:        }
        !           119:        exit(retcode != 0 ? retcode : nsucc == 0);
        !           120: }
        !           121: 
        !           122: compile(astr)
        !           123: char *astr;
        !           124: {
        !           125:        register c;
        !           126:        register char *ep, *sp;
        !           127:        char *lastep;
        !           128:        int cclcnt;
        !           129: 
        !           130:        ep = expbuf;
        !           131:        sp = astr;
        !           132:        if (*sp == '^') {
        !           133:                circf++;
        !           134:                sp++;
        !           135:        }
        !           136:        if (wflag)
        !           137:                *ep++ = CBRC;
        !           138:        for (;;) {
        !           139:                if (ep >= &expbuf[ESIZE])
        !           140:                        goto cerror;
        !           141:                if ((c = *sp++) != '*')
        !           142:                        lastep = ep;
        !           143:                switch (c) {
        !           144: 
        !           145:                case '\0':
        !           146:                        if (wflag)
        !           147:                                *ep++ = CLET;
        !           148:                        *ep++ = CEOF;
        !           149:                        return;
        !           150: 
        !           151:                case '.':
        !           152:                        *ep++ = CDOT;
        !           153:                        continue;
        !           154: 
        !           155:                case '*':
        !           156:                        if (lastep==0)
        !           157:                                goto defchar;
        !           158:                        *lastep |= STAR;
        !           159:                        continue;
        !           160: 
        !           161:                case '$':
        !           162:                        if (*sp != '\0')
        !           163:                                goto defchar;
        !           164:                        *ep++ = CDOL;
        !           165:                        continue;
        !           166: 
        !           167:                case '[':
        !           168:                        *ep++ = CCL;
        !           169:                        *ep++ = 0;
        !           170:                        cclcnt = 1;
        !           171:                        if ((c = *sp++) == '^') {
        !           172:                                c = *sp++;
        !           173:                                ep[-2] = NCCL;
        !           174:                        }
        !           175:                        do {
        !           176:                                *ep++ = c;
        !           177:                                cclcnt++;
        !           178:                                if (c=='\0' || ep >= &expbuf[ESIZE])
        !           179:                                        goto cerror;
        !           180:                        } while ((c = *sp++) != ']');
        !           181:                        lastep[1] = cclcnt;
        !           182:                        continue;
        !           183: 
        !           184:                case '\\':
        !           185:                        if ((c = *sp++) == '\0')
        !           186:                                goto cerror;
        !           187:                        if (c == '<') {
        !           188:                                *ep++ = CBRC;
        !           189:                                continue;
        !           190:                        }
        !           191:                        if (c == '>') {
        !           192:                                *ep++ = CLET;
        !           193:                                continue;
        !           194:                        }
        !           195:                defchar:
        !           196:                default:
        !           197:                        *ep++ = CCHR;
        !           198:                        *ep++ = c;
        !           199:                }
        !           200:        }
        !           201:     cerror:
        !           202:        fprintf(stderr, "grep: RE error\n");
        !           203:        exit(2);
        !           204: }
        !           205: 
        !           206: same(a, b)
        !           207:        register int a, b;
        !           208: {
        !           209: 
        !           210:        return (a == b || iflag && (a ^ b) == ' ' && letter(a) == letter(b));
        !           211: }
        !           212: 
        !           213: letter(c)
        !           214:        register int c;
        !           215: {
        !           216: 
        !           217:        if (c >= 'a' && c <= 'z')
        !           218:                return (c);
        !           219:        if (c >= 'A' && c <= 'Z')
        !           220:                return (c + 'a' - 'A');
        !           221:        return (0);
        !           222: }
        !           223: 
        !           224: execute(file)
        !           225: {
        !           226:        register char *p1, *p2;
        !           227:        register c;
        !           228:        int f;
        !           229:        char *ebp, *cbp;
        !           230:        static char *buf;
        !           231:        static int blksize;
        !           232:        struct stat stb;
        !           233: 
        !           234:        if (file) {
        !           235:                if ((f = open(file, 0)) < 0) {
        !           236:                        perror(file);
        !           237:                        retcode = 2;
        !           238:                }
        !           239:        } else
        !           240:                f = 0;
        !           241:        if (buf == NULL) {
        !           242:                if (fstat(f, &stb) > 0 && stb.st_blksize > 0)
        !           243:                        blksize = stb.st_blksize;
        !           244:                else
        !           245:                        blksize = BLKSIZE;
        !           246:                buf = (char *)malloc(blksize);
        !           247:                if (buf == NULL) {
        !           248:                        fprintf(stderr, "grep: no memory for %s\n", file);
        !           249:                        retcode = 2;
        !           250:                        return;
        !           251:                }
        !           252:        }
        !           253:        ebp = buf;
        !           254:        cbp = buf;
        !           255:        lnum = 0;
        !           256:        tln = 0;
        !           257:        blkno = -1;
        !           258:        for (;;) {
        !           259:                lnum++;
        !           260:                if((lnum&0377) == 0)
        !           261:                        fflush(stdout);
        !           262:                p1 = linebuf;
        !           263:                p2 = cbp;
        !           264:                for (;;) {
        !           265:                        if (p2 >= ebp) {
        !           266:                                if ((c = read(f, buf, blksize)) <= 0) {
        !           267:                                        close(f);
        !           268:                                        if (cflag) {
        !           269:                                                if (lflag) {
        !           270:                                                        if (tln)
        !           271:                                                        printf("%s\n", file);
        !           272:                                                } else {
        !           273:                                                        if (nfile > 1)
        !           274:                                                                printf("%s:", file);
        !           275:                                                        printf("%ld\n", tln);
        !           276:                                                }
        !           277:                                        }
        !           278:                                        return;
        !           279:                                }
        !           280:                                blkno++;
        !           281:                                p2 = buf;
        !           282:                                ebp = buf+c;
        !           283:                        }
        !           284:                        if ((c = *p2++) == '\n')
        !           285:                                break;
        !           286:                        if(c)
        !           287:                        if (p1 < &linebuf[BUFSIZ-1])
        !           288:                                *p1++ = c;
        !           289:                }
        !           290:                *p1++ = 0;
        !           291:                cbp = p2;
        !           292:                p1 = linebuf;
        !           293:                p2 = expbuf;
        !           294:                if (circf) {
        !           295:                        if (advance(p1, p2))
        !           296:                                goto found;
        !           297:                        goto nfound;
        !           298:                }
        !           299:                /* fast check for first character */
        !           300:                if (*p2==CCHR) {
        !           301:                        c = p2[1];
        !           302:                        do {
        !           303:                                if (*p1!=c && (!iflag || (c ^ *p1) != ' '
        !           304:                                        || letter(c) != letter(*p1)))
        !           305:                                        continue;
        !           306:                                if (advance(p1, p2))
        !           307:                                        goto found;
        !           308:                        } while (*p1++);
        !           309:                        goto nfound;
        !           310:                }
        !           311:                /* regular algorithm */
        !           312:                do {
        !           313:                        if (advance(p1, p2))
        !           314:                                goto found;
        !           315:                } while (*p1++);
        !           316:        nfound:
        !           317:                if (vflag)
        !           318:                        succeed(file);
        !           319:                continue;
        !           320:        found:
        !           321:                if (vflag==0)
        !           322:                        succeed(file);
        !           323:        }
        !           324: }
        !           325: 
        !           326: advance(alp, aep)
        !           327:        char *alp, *aep;
        !           328: {
        !           329:        register char *lp, *ep, *curlp;
        !           330:        char *nextep;
        !           331: 
        !           332:        lp = alp;
        !           333:        ep = aep;
        !           334:        for (;;) switch (*ep++) {
        !           335: 
        !           336:        case CCHR:
        !           337:                if (!same(*ep, *lp))
        !           338:                        return (0);
        !           339:                ep++, lp++;
        !           340:                continue;
        !           341: 
        !           342:        case CDOT:
        !           343:                if (*lp++)
        !           344:                        continue;
        !           345:                return(0);
        !           346: 
        !           347:        case CDOL:
        !           348:                if (*lp==0)
        !           349:                        continue;
        !           350:                return(0);
        !           351: 
        !           352:        case CEOF:
        !           353:                return(1);
        !           354: 
        !           355:        case CCL:
        !           356:                if (cclass(ep, *lp++, 1)) {
        !           357:                        ep += *ep;
        !           358:                        continue;
        !           359:                }
        !           360:                return(0);
        !           361: 
        !           362:        case NCCL:
        !           363:                if (cclass(ep, *lp++, 0)) {
        !           364:                        ep += *ep;
        !           365:                        continue;
        !           366:                }
        !           367:                return(0);
        !           368: 
        !           369:        case CDOT|STAR:
        !           370:                curlp = lp;
        !           371:                while (*lp++);
        !           372:                goto star;
        !           373: 
        !           374:        case CCHR|STAR:
        !           375:                curlp = lp;
        !           376:                while (same(*lp, *ep))
        !           377:                        lp++;
        !           378:                lp++;
        !           379:                ep++;
        !           380:                goto star;
        !           381: 
        !           382:        case CCL|STAR:
        !           383:        case NCCL|STAR:
        !           384:                curlp = lp;
        !           385:                while (cclass(ep, *lp++, ep[-1]==(CCL|STAR)));
        !           386:                ep += *ep;
        !           387:                goto star;
        !           388: 
        !           389:        star:
        !           390:                do {
        !           391:                        lp--;
        !           392:                        if (advance(lp, ep))
        !           393:                                return(1);
        !           394:                } while (lp > curlp);
        !           395:                return(0);
        !           396: 
        !           397:        case CBRC:
        !           398:                if (lp == expbuf)
        !           399:                        continue;
        !           400: #define        uletter(c)      (letter(c) || c == '_')
        !           401:                if ( ( uletter(*lp) || digit ( * lp ) )  && !uletter(lp[-1]) && !digit(lp[-1]))
        !           402:                        continue;
        !           403:                return (0);
        !           404: 
        !           405:        case CLET:
        !           406:                if (!uletter(*lp) && !digit(*lp))
        !           407:                        continue;
        !           408:                return (0);
        !           409: 
        !           410:        default:
        !           411:                fprintf(stderr, "grep: RE botch\n");
        !           412:                exit(2);
        !           413:        }
        !           414: }
        !           415: 
        !           416: cclass(aset, ac, af)
        !           417:        char *aset;
        !           418: {
        !           419:        register char *set, c;
        !           420:        register n;
        !           421: 
        !           422:        set = aset;
        !           423:        if ((c = ac) == 0)
        !           424:                return(0);
        !           425:        n = *set++;
        !           426:        while (--n)
        !           427:                if (n > 2 && set[1] == '-') {
        !           428:                        if (c >= (set[0] & 0177) && c <= (set[2] & 0177))
        !           429:                                return (af);
        !           430:                        set += 3;
        !           431:                        n -= 2;
        !           432:                } else
        !           433:                        if ((*set++ & 0177) == c)
        !           434:                                return(af);
        !           435:        return(!af);
        !           436: }
        !           437: 
        !           438: succeed(f)
        !           439: {
        !           440:        nsucc = 1;
        !           441:        if (sflag)
        !           442:                return;
        !           443:        if (cflag) {
        !           444:                tln++;
        !           445:                return;
        !           446:        }
        !           447:        if (nfile > 1)
        !           448:                printf("%s:", f);
        !           449:        if (bflag)
        !           450:                printf("%d:", blkno);
        !           451:        if (nflag)
        !           452:                printf("%ld:", lnum);
        !           453:        printf("%s\n", linebuf);
        !           454: }
        !           455: 
        !           456: digit(c)
        !           457:        char c;
        !           458: {
        !           459:        return (c>='0' && c<='9');
        !           460: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.