Annotation of 43BSDTahoe/ucb/checknr.c, revision 1.1

1.1     ! root        1: /*
        !             2:  * Copyright (c) 1980 Regents of the University of California.
        !             3:  * All rights reserved.  The Berkeley software License Agreement
        !             4:  * specifies the terms and conditions for redistribution.
        !             5:  */
        !             6: 
        !             7: #ifndef lint
        !             8: char copyright[] =
        !             9: "@(#) Copyright (c) 1980 Regents of the University of California.\n\
        !            10:  All rights reserved.\n";
        !            11: #endif not lint
        !            12: 
        !            13: #ifndef lint
        !            14: static char sccsid[] = "@(#)checknr.c  5.2 (Berkeley) 12/5/85";
        !            15: #endif not lint
        !            16: 
        !            17: /*
        !            18:  * checknr: check an nroff/troff input file for matching macro calls.
        !            19:  * we also attempt to match size and font changes, but only the embedded
        !            20:  * kind.  These must end in \s0 and \fP resp.  Maybe more sophistication
        !            21:  * later but for now think of these restrictions as contributions to
        !            22:  * structured typesetting.
        !            23:  */
        !            24: #include <stdio.h>
        !            25: #include <ctype.h>
        !            26: 
        !            27: #define MAXSTK 100     /* Stack size */
        !            28: #define MAXBR  100     /* Max number of bracket pairs known */
        !            29: #define MAXCMDS        500     /* Max number of commands known */
        !            30: 
        !            31: /*
        !            32:  * The stack on which we remember what we've seen so far.
        !            33:  */
        !            34: struct stkstr {
        !            35:        int opno;       /* number of opening bracket */
        !            36:        int pl;         /* '+', '-', ' ' for \s, 1 for \f, 0 for .ft */
        !            37:        int parm;       /* parm to size, font, etc */
        !            38:        int lno;        /* line number the thing came in in */
        !            39: } stk[MAXSTK];
        !            40: int stktop;
        !            41: 
        !            42: /*
        !            43:  * The kinds of opening and closing brackets.
        !            44:  */
        !            45: struct brstr {
        !            46:        char *opbr;
        !            47:        char *clbr;
        !            48: } br[MAXBR] = {
        !            49:        /* A few bare bones troff commands */
        !            50: #define SZ     0
        !            51:        "sz",   "sz",   /* also \s */
        !            52: #define FT     1
        !            53:        "ft",   "ft",   /* also \f */
        !            54:        /* the -mm package */
        !            55:        "AL",   "LE",
        !            56:        "AS",   "AE",
        !            57:        "BL",   "LE",
        !            58:        "BS",   "BE",
        !            59:        "DF",   "DE",
        !            60:        "DL",   "LE",
        !            61:        "DS",   "DE",
        !            62:        "FS",   "FE",
        !            63:        "ML",   "LE",
        !            64:        "NS",   "NE",
        !            65:        "RL",   "LE",
        !            66:        "VL",   "LE",
        !            67:        /* the -ms package */
        !            68:        "AB",   "AE",
        !            69:        "BD",   "DE",
        !            70:        "CD",   "DE",
        !            71:        "DS",   "DE",
        !            72:        "FS",   "FE",
        !            73:        "ID",   "DE",
        !            74:        "KF",   "KE",
        !            75:        "KS",   "KE",
        !            76:        "LD",   "DE",
        !            77:        "LG",   "NL",
        !            78:        "QS",   "QE",
        !            79:        "RS",   "RE",
        !            80:        "SM",   "NL",
        !            81:        "XA",   "XE",
        !            82:        "XS",   "XE",
        !            83:        /* The -me package */
        !            84:        "(b",   ")b",
        !            85:        "(c",   ")c",
        !            86:        "(d",   ")d",
        !            87:        "(f",   ")f",
        !            88:        "(l",   ")l",
        !            89:        "(q",   ")q",
        !            90:        "(x",   ")x",
        !            91:        "(z",   ")z",
        !            92:        /* Things needed by preprocessors */
        !            93:        "EQ",   "EN",
        !            94:        "TS",   "TE",
        !            95:        /* Refer */
        !            96:        "[",    "]",
        !            97:        0,      0
        !            98: };
        !            99: 
        !           100: /*
        !           101:  * All commands known to nroff, plus macro packages.
        !           102:  * Used so we can complain about unrecognized commands.
        !           103:  */
        !           104: char *knowncmds[MAXCMDS] = {
        !           105: "$c", "$f", "$h", "$p", "$s", "(b", "(c", "(d", "(f", "(l", "(q", "(t",
        !           106: "(x", "(z", ")b", ")c", ")d", ")f", ")l", ")q", ")t", ")x", ")z", "++",
        !           107: "+c", "1C", "1c", "2C", "2c", "@(", "@)", "@C", "@D", "@F", "@I", "@M",
        !           108: "@c", "@e", "@f", "@h", "@m", "@n", "@o", "@p", "@r", "@t", "@z", "AB",
        !           109: "AE", "AF", "AI", "AL", "AM", "AS", "AT", "AU", "AX", "B",  "B1", "B2",
        !           110: "BD", "BE", "BG", "BL", "BS", "BT", "BX", "C1", "C2", "CD", "CM", "CT",
        !           111: "D",  "DA", "DE", "DF", "DL", "DS", "DT", "EC", "EF", "EG", "EH", "EM",
        !           112: "EN", "EQ", "EX", "FA", "FD", "FE", "FG", "FJ", "FK", "FL", "FN", "FO",
        !           113: "FQ", "FS", "FV", "FX", "H",  "HC", "HD", "HM", "HO", "HU", "I",  "ID",
        !           114: "IE", "IH", "IM", "IP", "IX", "IZ", "KD", "KE", "KF", "KQ", "KS", "LB",
        !           115: "LC", "LD", "LE", "LG", "LI", "LP", "MC", "ME", "MF", "MH", "ML", "MR",
        !           116: "MT", "ND", "NE", "NH", "NL", "NP", "NS", "OF", "OH", "OK", "OP", "P",
        !           117: "P1", "PF", "PH", "PP", "PT", "PX", "PY", "QE", "QP", "QS", "R",  "RA",
        !           118: "RC", "RE", "RL", "RP", "RQ", "RS", "RT", "S",  "S0", "S2", "S3", "SA",
        !           119: "SG", "SH", "SK", "SM", "SP", "SY", "T&", "TA", "TB", "TC", "TD", "TE",
        !           120: "TH", "TL", "TM", "TP", "TQ", "TR", "TS", "TX", "UL", "US", "UX", "VL",
        !           121: "WC", "WH", "XA", "XD", "XE", "XF", "XK", "XP", "XS", "[",  "[-", "[0",
        !           122: "[1", "[2", "[3", "[4", "[5", "[<", "[>", "[]", "]",  "]-", "]<", "]>",
        !           123: "][", "ab", "ac", "ad", "af", "am", "ar", "as", "b",  "ba", "bc", "bd",
        !           124: "bi", "bl", "bp", "br", "bx", "c.", "c2", "cc", "ce", "cf", "ch", "cs",
        !           125: "ct", "cu", "da", "de", "di", "dl", "dn", "ds", "dt", "dw", "dy", "ec",
        !           126: "ef", "eh", "el", "em", "eo", "ep", "ev", "ex", "fc", "fi", "fl", "fo",
        !           127: "fp", "ft", "fz", "hc", "he", "hl", "hp", "ht", "hw", "hx", "hy", "i",
        !           128: "ie", "if", "ig", "in", "ip", "it", "ix", "lc", "lg", "li", "ll", "ln",
        !           129: "lo", "lp", "ls", "lt", "m1", "m2", "m3", "m4", "mc", "mk", "mo", "n1",
        !           130: "n2", "na", "ne", "nf", "nh", "nl", "nm", "nn", "np", "nr", "ns", "nx",
        !           131: "of", "oh", "os", "pa", "pc", "pi", "pl", "pm", "pn", "po", "pp", "ps",
        !           132: "q",  "r",  "rb", "rd", "re", "rm", "rn", "ro", "rr", "rs", "rt", "sb",
        !           133: "sc", "sh", "sk", "so", "sp", "ss", "st", "sv", "sz", "ta", "tc", "th",
        !           134: "ti", "tl", "tm", "tp", "tr", "u",  "uf", "uh", "ul", "vs", "wh", "xp",
        !           135: "yr", 0
        !           136: };
        !           137: 
        !           138: int    lineno;         /* current line number in input file */
        !           139: char   line[256];      /* the current line */
        !           140: char   *cfilename;     /* name of current file */
        !           141: int    nfiles;         /* number of files to process */
        !           142: int    fflag;          /* -f: ignore \f */
        !           143: int    sflag;          /* -s: ignore \s */
        !           144: int    ncmds;          /* size of knowncmds */
        !           145: int    slot;           /* slot in knowncmds found by binsrch */
        !           146: 
        !           147: char   *malloc();
        !           148: 
        !           149: main(argc, argv)
        !           150: int argc;
        !           151: char **argv;
        !           152: {
        !           153:        FILE *f;
        !           154:        int i;
        !           155:        char *cp;
        !           156:        char b1[4];
        !           157: 
        !           158:        /* Figure out how many known commands there are */
        !           159:        while (knowncmds[ncmds])
        !           160:                ncmds++;
        !           161:        while (argc > 1 && argv[1][0] == '-') {
        !           162:                switch(argv[1][1]) {
        !           163: 
        !           164:                /* -a: add pairs of macros */
        !           165:                case 'a':
        !           166:                        i = strlen(argv[1]) - 2;
        !           167:                        if (i % 6 != 0)
        !           168:                                usage();
        !           169:                        /* look for empty macro slots */
        !           170:                        for (i=0; br[i].opbr; i++)
        !           171:                                ;
        !           172:                        for (cp=argv[1]+3; cp[-1]; cp += 6) {
        !           173:                                br[i].opbr = malloc(3);
        !           174:                                strncpy(br[i].opbr, cp, 2);
        !           175:                                br[i].clbr = malloc(3);
        !           176:                                strncpy(br[i].clbr, cp+3, 2);
        !           177:                                addmac(br[i].opbr);     /* knows pairs are also known cmds */
        !           178:                                addmac(br[i].clbr);
        !           179:                                i++;
        !           180:                        }
        !           181:                        break;
        !           182: 
        !           183:                /* -c: add known commands */
        !           184:                case 'c':
        !           185:                        i = strlen(argv[1]) - 2;
        !           186:                        if (i % 3 != 0)
        !           187:                                usage();
        !           188:                        for (cp=argv[1]+3; cp[-1]; cp += 3) {
        !           189:                                if (cp[2] && cp[2] != '.')
        !           190:                                        usage();
        !           191:                                strncpy(b1, cp, 2);
        !           192:                                addmac(b1);
        !           193:                        }
        !           194:                        break;
        !           195: 
        !           196:                /* -f: ignore font changes */
        !           197:                case 'f':
        !           198:                        fflag = 1;
        !           199:                        break;
        !           200: 
        !           201:                /* -s: ignore size changes */
        !           202:                case 's':
        !           203:                        sflag = 1;
        !           204:                        break;
        !           205:                default:
        !           206:                        usage();
        !           207:                }
        !           208:                argc--; argv++;
        !           209:        }
        !           210: 
        !           211:        nfiles = argc - 1;
        !           212: 
        !           213:        if (nfiles > 0) {
        !           214:                for (i=1; i<argc; i++) {
        !           215:                        cfilename = argv[i];
        !           216:                        f = fopen(cfilename, "r");
        !           217:                        if (f == NULL)
        !           218:                                perror(cfilename);
        !           219:                        else
        !           220:                                process(f);
        !           221:                }
        !           222:        } else {
        !           223:                cfilename = "stdin";
        !           224:                process(stdin);
        !           225:        }
        !           226:        exit(0);
        !           227: }
        !           228: 
        !           229: usage()
        !           230: {
        !           231:        printf("Usage: checknr -s -f -a.xx.yy.xx.yy... -c.xx.xx.xx...\n");
        !           232:        exit(1);
        !           233: }
        !           234: 
        !           235: process(f)
        !           236: FILE *f;
        !           237: {
        !           238:        register int i, n;
        !           239:        char mac[5];    /* The current macro or nroff command */
        !           240:        int pl;
        !           241: 
        !           242:        stktop = -1;
        !           243:        for (lineno = 1; fgets(line, sizeof line, f); lineno++) {
        !           244:                if (line[0] == '.') {
        !           245:                        /*
        !           246:                         * find and isolate the macro/command name.
        !           247:                         */
        !           248:                        strncpy(mac, line+1, 4);
        !           249:                        if (isspace(mac[0])) {
        !           250:                                pe(lineno);
        !           251:                                printf("Empty command\n");
        !           252:                        } else if (isspace(mac[1])) {
        !           253:                                mac[1] = 0;
        !           254:                        } else if (isspace(mac[2])) {
        !           255:                                mac[2] = 0;
        !           256:                        } else if (mac[0] != '\\' || mac[1] != '\"') {
        !           257:                                pe(lineno);
        !           258:                                printf("Command too long\n");
        !           259:                        }
        !           260: 
        !           261:                        /*
        !           262:                         * Is it a known command?
        !           263:                         */
        !           264:                        checkknown(mac);
        !           265: 
        !           266:                        /*
        !           267:                         * Should we add it?
        !           268:                         */
        !           269:                        if (eq(mac, "de"))
        !           270:                                addcmd(line);
        !           271: 
        !           272:                        chkcmd(line, mac);
        !           273:                }
        !           274: 
        !           275:                /*
        !           276:                 * At this point we process the line looking
        !           277:                 * for \s and \f.
        !           278:                 */
        !           279:                for (i=0; line[i]; i++)
        !           280:                        if (line[i]=='\\' && (i==0 || line[i-1]!='\\')) {
        !           281:                                if (!sflag && line[++i]=='s') {
        !           282:                                        pl = line[++i];
        !           283:                                        if (isdigit(pl)) {
        !           284:                                                n = pl - '0';
        !           285:                                                pl = ' ';
        !           286:                                        } else
        !           287:                                                n = 0;
        !           288:                                        while (isdigit(line[++i]))
        !           289:                                                n = 10 * n + line[i] - '0';
        !           290:                                        i--;
        !           291:                                        if (n == 0) {
        !           292:                                                if (stk[stktop].opno == SZ) {
        !           293:                                                        stktop--;
        !           294:                                                } else {
        !           295:                                                        pe(lineno);
        !           296:                                                        printf("unmatched \\s0\n");
        !           297:                                                }
        !           298:                                        } else {
        !           299:                                                stk[++stktop].opno = SZ;
        !           300:                                                stk[stktop].pl = pl;
        !           301:                                                stk[stktop].parm = n;
        !           302:                                                stk[stktop].lno = lineno;
        !           303:                                        }
        !           304:                                } else if (!fflag && line[i]=='f') {
        !           305:                                        n = line[++i];
        !           306:                                        if (n == 'P') {
        !           307:                                                if (stk[stktop].opno == FT) {
        !           308:                                                        stktop--;
        !           309:                                                } else {
        !           310:                                                        pe(lineno);
        !           311:                                                        printf("unmatched \\fP\n");
        !           312:                                                }
        !           313:                                        } else {
        !           314:                                                stk[++stktop].opno = FT;
        !           315:                                                stk[stktop].pl = 1;
        !           316:                                                stk[stktop].parm = n;
        !           317:                                                stk[stktop].lno = lineno;
        !           318:                                        }
        !           319:                                }
        !           320:                        }
        !           321:        }
        !           322:        /*
        !           323:         * We've hit the end and look at all this stuff that hasn't been
        !           324:         * matched yet!  Complain, complain.
        !           325:         */
        !           326:        for (i=stktop; i>=0; i--) {
        !           327:                complain(i);
        !           328:        }
        !           329: }
        !           330: 
        !           331: complain(i)
        !           332: {
        !           333:        pe(stk[i].lno);
        !           334:        printf("Unmatched ");
        !           335:        prop(i);
        !           336:        printf("\n");
        !           337: }
        !           338: 
        !           339: prop(i)
        !           340: {
        !           341:        if (stk[i].pl == 0)
        !           342:                printf(".%s", br[stk[i].opno].opbr);
        !           343:        else switch(stk[i].opno) {
        !           344:        case SZ:
        !           345:                printf("\\s%c%d", stk[i].pl, stk[i].parm);
        !           346:                break;
        !           347:        case FT:
        !           348:                printf("\\f%c", stk[i].parm);
        !           349:                break;
        !           350:        default:
        !           351:                printf("Bug: stk[%d].opno = %d = .%s, .%s",
        !           352:                        i, stk[i].opno, br[stk[i].opno].opbr, br[stk[i].opno].clbr);
        !           353:        }
        !           354: }
        !           355: 
        !           356: chkcmd(line, mac)
        !           357: char *line;
        !           358: char *mac;
        !           359: {
        !           360:        register int i, n;
        !           361: 
        !           362:        /*
        !           363:         * Check to see if it matches top of stack.
        !           364:         */
        !           365:        if (stktop >= 0 && eq(mac, br[stk[stktop].opno].clbr))
        !           366:                stktop--;       /* OK. Pop & forget */
        !           367:        else {
        !           368:                /* No. Maybe it's an opener */
        !           369:                for (i=0; br[i].opbr; i++) {
        !           370:                        if (eq(mac, br[i].opbr)) {
        !           371:                                /* Found. Push it. */
        !           372:                                stktop++;
        !           373:                                stk[stktop].opno = i;
        !           374:                                stk[stktop].pl = 0;
        !           375:                                stk[stktop].parm = 0;
        !           376:                                stk[stktop].lno = lineno;
        !           377:                                break;
        !           378:                        }
        !           379:                        /*
        !           380:                         * Maybe it's an unmatched closer.
        !           381:                         * NOTE: this depends on the fact
        !           382:                         * that none of the closers can be
        !           383:                         * openers too.
        !           384:                         */
        !           385:                        if (eq(mac, br[i].clbr)) {
        !           386:                                nomatch(mac);
        !           387:                                break;
        !           388:                        }
        !           389:                }
        !           390:        }
        !           391: }
        !           392: 
        !           393: nomatch(mac)
        !           394: char *mac;
        !           395: {
        !           396:        register int i, j;
        !           397: 
        !           398:        /*
        !           399:         * Look for a match further down on stack
        !           400:         * If we find one, it suggests that the stuff in
        !           401:         * between is supposed to match itself.
        !           402:         */
        !           403:        for (j=stktop; j>=0; j--)
        !           404:                if (eq(mac,br[stk[j].opno].clbr)) {
        !           405:                        /* Found.  Make a good diagnostic. */
        !           406:                        if (j == stktop-2) {
        !           407:                                /*
        !           408:                                 * Check for special case \fx..\fR and don't
        !           409:                                 * complain.
        !           410:                                 */
        !           411:                                if (stk[j+1].opno==FT && stk[j+1].parm!='R'
        !           412:                                 && stk[j+2].opno==FT && stk[j+2].parm=='R') {
        !           413:                                        stktop = j -1;
        !           414:                                        return;
        !           415:                                }
        !           416:                                /*
        !           417:                                 * We have two unmatched frobs.  Chances are
        !           418:                                 * they were intended to match, so we mention
        !           419:                                 * them together.
        !           420:                                 */
        !           421:                                pe(stk[j+1].lno);
        !           422:                                prop(j+1);
        !           423:                                printf(" does not match %d: ", stk[j+2].lno);
        !           424:                                prop(j+2);
        !           425:                                printf("\n");
        !           426:                        } else for (i=j+1; i <= stktop; i++) {
        !           427:                                complain(i);
        !           428:                        }
        !           429:                        stktop = j-1;
        !           430:                        return;
        !           431:                }
        !           432:        /* Didn't find one.  Throw this away. */
        !           433:        pe(lineno);
        !           434:        printf("Unmatched .%s\n", mac);
        !           435: }
        !           436: 
        !           437: /* eq: are two strings equal? */
        !           438: eq(s1, s2)
        !           439: char *s1, *s2;
        !           440: {
        !           441:        return (strcmp(s1, s2) == 0);
        !           442: }
        !           443: 
        !           444: /* print the first part of an error message, given the line number */
        !           445: pe(lineno)
        !           446: int lineno;
        !           447: {
        !           448:        if (nfiles > 1)
        !           449:                printf("%s: ", cfilename);
        !           450:        printf("%d: ", lineno);
        !           451: }
        !           452: 
        !           453: checkknown(mac)
        !           454: char *mac;
        !           455: {
        !           456: 
        !           457:        if (eq(mac, "."))
        !           458:                return;
        !           459:        if (binsrch(mac) >= 0)
        !           460:                return;
        !           461:        if (mac[0] == '\\' && mac[1] == '"')    /* comments */
        !           462:                return;
        !           463: 
        !           464:        pe(lineno);
        !           465:        printf("Unknown command: .%s\n", mac);
        !           466: }
        !           467: 
        !           468: /*
        !           469:  * We have a .de xx line in "line".  Add xx to the list of known commands.
        !           470:  */
        !           471: addcmd(line)
        !           472: char *line;
        !           473: {
        !           474:        char *mac;
        !           475: 
        !           476:        /* grab the macro being defined */
        !           477:        mac = line+4;
        !           478:        while (isspace(*mac))
        !           479:                mac++;
        !           480:        if (*mac == 0) {
        !           481:                pe(lineno);
        !           482:                printf("illegal define: %s\n", line);
        !           483:                return;
        !           484:        }
        !           485:        mac[2] = 0;
        !           486:        if (isspace(mac[1]) || mac[1] == '\\')
        !           487:                mac[1] = 0;
        !           488:        if (ncmds >= MAXCMDS) {
        !           489:                printf("Only %d known commands allowed\n", MAXCMDS);
        !           490:                exit(1);
        !           491:        }
        !           492:        addmac(mac);
        !           493: }
        !           494: 
        !           495: /*
        !           496:  * Add mac to the list.  We should really have some kind of tree
        !           497:  * structure here but this is a quick-and-dirty job and I just don't
        !           498:  * have time to mess with it.  (I wonder if this will come back to haunt
        !           499:  * me someday?)  Anyway, I claim that .de is fairly rare in user
        !           500:  * nroff programs, and the register loop below is pretty fast.
        !           501:  */
        !           502: addmac(mac)
        !           503: char *mac;
        !           504: {
        !           505:        register char **src, **dest, **loc;
        !           506: 
        !           507:        if (binsrch(mac) >= 0){ /* it's OK to redefine something */
        !           508: #ifdef DEBUG
        !           509:                printf("binsrch(%s) -> already in table\n", mac);
        !           510: #endif DEBUG
        !           511:                return;
        !           512:        }
        !           513:        /* binsrch sets slot as a side effect */
        !           514: #ifdef DEBUG
        !           515: printf("binsrch(%s) -> %d\n", mac, slot);
        !           516: #endif
        !           517:        loc = &knowncmds[slot];
        !           518:        src = &knowncmds[ncmds-1];
        !           519:        dest = src+1;
        !           520:        while (dest > loc)
        !           521:                *dest-- = *src--;
        !           522:        *loc = malloc(3);
        !           523:        strcpy(*loc, mac);
        !           524:        ncmds++;
        !           525: #ifdef DEBUG
        !           526: printf("after: %s %s %s %s %s, %d cmds\n", knowncmds[slot-2], knowncmds[slot-1], knowncmds[slot], knowncmds[slot+1], knowncmds[slot+2], ncmds);
        !           527: #endif
        !           528: }
        !           529: 
        !           530: /*
        !           531:  * Do a binary search in knowncmds for mac.
        !           532:  * If found, return the index.  If not, return -1.
        !           533:  */
        !           534: binsrch(mac)
        !           535: char *mac;
        !           536: {
        !           537:        register char *p;       /* pointer to current cmd in list */
        !           538:        register int d;         /* difference if any */
        !           539:        register int mid;       /* mid point in binary search */
        !           540:        register int top, bot;  /* boundaries of bin search, inclusive */
        !           541: 
        !           542:        top = ncmds-1;
        !           543:        bot = 0;
        !           544:        while (top >= bot) {
        !           545:                mid = (top+bot)/2;
        !           546:                p = knowncmds[mid];
        !           547:                d = p[0] - mac[0];
        !           548:                if (d == 0)
        !           549:                        d = p[1] - mac[1];
        !           550:                if (d == 0)
        !           551:                        return mid;
        !           552:                if (d < 0)
        !           553:                        bot = mid + 1;
        !           554:                else
        !           555:                        top = mid - 1;
        !           556:        }
        !           557:        slot = bot;     /* place it would have gone */
        !           558:        return -1;
        !           559: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.