Annotation of 43BSDTahoe/usr.bin/diction/diction.c, revision 1.1.1.1

1.1       root        1: #ifndef lint
                      2: static char sccsid[] = "@(#)diction.c  4.2     (Berkeley)      82/11/06";
                      3: #endif not lint
                      4: 
                      5: /*
                      6:  * diction -- print all sentences containing one of default phrases
                      7:  *
                      8:  *     status returns:
                      9:  *             0 - ok, and some matches
                     10:  *             1 - ok, but no matches
                     11:  *             2 - some error
                     12:  */
                     13: 
                     14: #include <stdio.h>
                     15: #include <ctype.h>
                     16: 
                     17: #define        MAXSIZ 6500
                     18: #define QSIZE 650
                     19: int linemsg;
                     20: long olcount;
                     21: long lcount;
                     22: struct words {
                     23:        char    inp;
                     24:        char    out;
                     25:        struct  words *nst;
                     26:        struct  words *link;
                     27:        struct  words *fail;
                     28: } w[MAXSIZ], *smax, *q;
                     29: 
                     30: char table[128] = {
                     31:        0, 0, 0, 0, 0, 0, 0, 0,
                     32:        0, 0, ' ', 0, 0, 0, 0, 0,
                     33:        0, 0, 0, 0, 0, 0, 0, 0,
                     34:        0, 0, 0, 0, 0, 0, 0, 0,
                     35:        ' ', '.', ' ', ' ', ' ', ' ', ' ', ' ',
                     36:        ' ', ' ', ' ', ' ', ' ', ' ', '.', ' ',
                     37:        '0', '1', '2', '3', '4', '5', '6', '7',
                     38:        '8', '9', ' ', ' ', ' ', ' ', ' ', '.',
                     39:        ' ', 'a', 'b', 'c', 'd', 'e', 'f', 'g',
                     40:        'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o',
                     41:        'p', 'q', 'r', 's', 't', 'u', 'v', 'w',
                     42:        'x', 'y', 'z', ' ', ' ', ' ', ' ', ' ',
                     43:        ' ', 'a', 'b', 'c', 'd', 'e', 'f', 'g',
                     44:        'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o',
                     45:        'p', 'q', 'r', 's', 't', 'u', 'v', 'w',
                     46:        'x', 'y', 'z', ' ', ' ', ' ', ' ', ' '
                     47:        };
                     48: int    caps = 0;
                     49: int    lineno = 0;
                     50: int fflag;
                     51: int nflag      = 1; /*use default file*/
                     52: char *filename;
                     53: int    mflg    = 0;    /*don't catch output*/
                     54: int    nfile;
                     55: int    nsucc;
                     56: long nsent = 0;
                     57: long nhits = 0;
                     58: char *nlp;
                     59: char *begp, *endp;
                     60: int beg, last;
                     61: char *myst;
                     62: int myct = 0;
                     63: int oct = 0;
                     64: FILE   *wordf;
                     65: FILE *mine;
                     66: char   *argptr;
                     67: long tl = 0;
                     68: long th = 0;
                     69: 
                     70: main(argc, argv)
                     71: char *argv[];
                     72: {
                     73:        int sv;
                     74:        while (--argc > 0 && (++argv)[0][0]=='-')
                     75:                switch (argv[0][1]) {
                     76: 
                     77:                case 'f':
                     78:                        fflag++;
                     79:                        filename = (++argv)[0];
                     80:                        argc--;
                     81:                        continue;
                     82: 
                     83:                case 'n':
                     84:                        nflag = 0;
                     85:                        continue;
                     86:                case 'd':
                     87:                        mflg=0;
                     88:                        continue;
                     89:                case 'c':
                     90:                        caps++;
                     91:                        continue;
                     92:                case 'l':
                     93:                        lineno++;
                     94:                        continue;
                     95:                default:
                     96:                        fprintf(stderr, "diction: unknown flag\n");
                     97:                        continue;
                     98:                }
                     99: out:
                    100:        if(nflag){
                    101:                wordf = fopen(DICT,"r");
                    102:                if(wordf == NULL){
                    103:                        fprintf(stderr,"diction: can't open default dictionary\n");
                    104:                        exit(2);
                    105:                }
                    106:        }
                    107:        else {
                    108:                wordf = fopen(filename,"r");
                    109:                if(wordf == NULL){
                    110:                        fprintf(stderr,"diction: can't open %s\n",filename);
                    111:                        exit(2);
                    112:                }
                    113:        }
                    114: 
                    115: #ifdef CATCH
                    116:        if(fopen(CATCH,"r") != NULL)
                    117:                if((mine=fopen(CATCH,"a"))!=NULL)mflg=1;
                    118: #endif
                    119: #ifdef MACS
                    120:        if(caps){
                    121:                printf(".so ");
                    122:                printf(MACS);
                    123:                printf("\n");
                    124:        }
                    125: #endif
                    126:        cgotofn();
                    127:        cfail();
                    128:        nfile = argc;
                    129:        if (argc<=0) {
                    130:                execute((char *)NULL);
                    131:        }
                    132:        else while (--argc >= 0) {
                    133:                execute(*argv);
                    134:                if(lineno){
                    135:                        printf("file %s: number of lines %ld number of phrases found %ld\n",
                    136:                                *argv, lcount-1, nhits);
                    137:                        tl += lcount-1;
                    138:                        th += nhits;
                    139:                        sv = lcount-1;
                    140:                        lcount = nhits = 0;
                    141:                }
                    142:                argv++;
                    143:        }
                    144:        if(mflg)fprintf(mine,"number of sentences %ld %ld number of hits %ld %ld\n",nsent,tl,nhits,th);
                    145:        if(!caps&& !lineno)printf("number of sentences %ld number of phrases found %ld\n",nsent,nhits);
                    146:        else if(tl != sv)
                    147:                 if(!caps)printf("totals: number of lines %ld number of phrases found %ld\n",tl,th);
                    148:        exit(nsucc == 0);
                    149: }
                    150: 
                    151: execute(file)
                    152: char *file;
                    153: {
                    154:        register char *p;
                    155:        register struct words *c;
                    156:        register ccount;
                    157:        int count1;
                    158:        char *beg1;
                    159:        struct words *savc;
                    160:        char *savp;
                    161:        int savct;
                    162:        int scr;
                    163:        char buf[1024];
                    164:        int f;
                    165:        int hit;
                    166:        last = 0;
                    167:        if (file) {
                    168:                if ((f = open(file, 0)) < 0) {
                    169:                        fprintf(stderr, "diction: can't open %s\n", file);
                    170:                        exit(2);
                    171:                }
                    172:        }
                    173:        else f = 0;
                    174:        lcount = olcount = 1;
                    175:        linemsg = 1;
                    176:        ccount = 0;
                    177:        count1 = -1;
                    178:        p = buf;
                    179:        nlp = p;
                    180:        c = w;
                    181:        oct = hit = 0;
                    182:        savc = (struct words *) 0;
                    183:        savp = (char *) 0;
                    184:        for (;;) {
                    185:                if(--ccount <= 0) {
                    186:                        if (p == &buf[1024]) p = buf;
                    187:                        if (p > &buf[512]) {
                    188:                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
                    189:                        }
                    190:                        else if ((ccount = read(f, p, 512)) <= 0) break;
                    191:                        if(caps && (count1 > 0))
                    192:                                fwrite(beg1,sizeof(*beg1),count1,stdout);
                    193:                        count1 = ccount;
                    194:                        beg1 = p;
                    195:                }
                    196:                if(p == &buf[1024])p=buf;
                    197:                nstate:
                    198:                        if (c->inp == table[*p]) {
                    199:                                c = c->nst;
                    200:                        }
                    201:                        else if (c->link != 0) {
                    202:                                c = c->link;
                    203:                                goto nstate;
                    204:                        }
                    205:                        else {
                    206:                                if(savp != 0){
                    207:                                        c=savc;
                    208:                                        p=savp;
                    209:                                        if(ccount > savct)ccount += savct;
                    210:                                        else ccount = savct;
                    211:                                        savc = (struct words *) 0;
                    212:                                        savp = (char *) 0;
                    213:                                        goto hadone;
                    214:                                }
                    215:                                c = c->fail;
                    216:                                if (c==0) {
                    217:                                        c = w;
                    218:                                        istate:
                    219:                                        if (c->inp == table[*p]) {
                    220:                                                c = c->nst;
                    221:                                        }
                    222:                                        else if (c->link != 0) {
                    223:                                                c = c->link;
                    224:                                                goto istate;
                    225:                                        }
                    226:                                }
                    227:                                else goto nstate;
                    228:                        }
                    229:                if(c->out){
                    230:                        if((c->inp == table[*(p+1)]) && (c->nst != 0)){
                    231:                                savp=p;
                    232:                                savc=c;
                    233:                                savct=ccount;
                    234:                                goto cont;
                    235:                        }
                    236:                        else if(c->link != 0){
                    237:                                savc=c;
                    238:                                while((savc=savc->link)!= 0){
                    239:                                        if(savc->inp == table[*(p+1)]){
                    240:                                                savp=p;
                    241:                                                savc=c;
                    242:                                                savct=ccount;
                    243:                                                goto cont;
                    244:                                        }
                    245:                                }
                    246:                        }
                    247:                hadone:
                    248:                        savc = (struct words *) 0;
                    249:                        savp = (char *) 0;
                    250:                        if(c->out == (char)(0377)){
                    251:                                c=w;
                    252:                                goto nstate;
                    253:                        }
                    254:                        begp = p - (c->out);
                    255:                        if(begp < &buf[0])begp = &buf[1024] - (&buf[0]-begp);
                    256:                        endp=p;
                    257:                        if(mflg){
                    258:                                if(begp-20 < &buf[0]){
                    259:                                        myst = &buf[1024]-20;
                    260:                                        if(nlp < &buf[512])myst=nlp;
                    261:                                }
                    262:                                else myst = begp-20;
                    263:                                if(myst < nlp)myst = nlp;
                    264:                                beg = 0;
                    265:                        }
                    266:                        hit = 1;
                    267:                        nhits++;
                    268:                        if(*p == '\n')lcount++;
                    269:                        if (table[*p++] == '.') {
                    270:                                linemsg = 1;
                    271:                                if (--ccount <= 0) {
                    272:                                        if (p == &buf[1024]) p = buf;
                    273:                                        if (p > &buf[512]) {
                    274:                                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
                    275:                                        }
                    276:                                        else if ((ccount = read(f, p, 512)) <= 0) break;
                    277:                                        if(caps && (count1 > 0))
                    278:                                                fwrite(beg1,sizeof(*beg1),count1,stdout);
                    279:                                        count1=ccount;
                    280:                                        beg1=p;
                    281:                                }
                    282:                        }
                    283:        succeed:        nsucc = 1;
                    284:                        {
                    285:                                if (p <= nlp) {
                    286:                                        outc(&buf[1024],file);
                    287:                                        nlp = buf;
                    288:                                }
                    289:                                outc(p,file);
                    290:                        }
                    291:                        if(mflg)last=1;
                    292:        nomatch:
                    293:                        nlp = p;
                    294:                        c = w;
                    295:                        begp = endp = 0;
                    296:                        continue;
                    297:                }
                    298:        cont:
                    299:                if(*p == '\n')lcount++;
                    300:                if (table[*p++] == '.'){
                    301:                                if(hit){
                    302:                                        if(p <= nlp){
                    303:                                                outc(&buf[1024],file);
                    304:                                                nlp = buf;
                    305:                                        }
                    306:                                        outc(p,file);
                    307:                                        if(!caps)printf("\n\n");
                    308:                                        if(mflg && last){putc('\n',mine);myct = 0;}
                    309:                                        }
                    310:                                linemsg = 1;
                    311:                                if(*p == '\n')olcount = lcount+1;
                    312:                                else
                    313:                                        olcount=lcount;
                    314:                                last = 0;
                    315:                                hit = 0;
                    316:                                oct = 0;
                    317:                                nlp = p;
                    318:                                c = w;
                    319:                                begp = endp = 0;
                    320:                                nsent++;
                    321:                        }
                    322:        }
                    323:        if(caps && (count1 > 0))
                    324:                fwrite(beg1,sizeof(*beg1),count1,stdout);
                    325:        close(f);
                    326: }
                    327: 
                    328: getargc()
                    329: {
                    330:        register c;
                    331:        if (wordf){
                    332:                if((c=getc(wordf))==EOF){
                    333:                        fclose(wordf);
                    334:                        if(nflag && fflag){
                    335:                                nflag=0;
                    336:                                wordf=fopen(filename,"r");
                    337:                                if(wordf == NULL){
                    338:                                        fprintf("diction can't open %s\n",filename);
                    339:                                        exit(2);
                    340:                                }
                    341:                                return(getc(wordf));
                    342:                        }
                    343:                        else return(EOF);
                    344:                }
                    345:                else return(c);
                    346:        }
                    347:        if ((c = *argptr++) == '\0')
                    348:                return(EOF);
                    349:        return(c);
                    350: }
                    351: 
                    352: cgotofn() {
                    353:        register c;
                    354:        register struct words *s;
                    355:        register ct;
                    356:        int neg;
                    357: 
                    358:        s = smax = w;
                    359:        neg = ct = 0;
                    360: nword: for(;;) {
                    361:                c = getargc();
                    362:                if(c == '~'){
                    363:                        neg++;
                    364:                        c = getargc();
                    365:                }
                    366:                if (c==EOF)
                    367:                        return;
                    368:                if (c == '\n') {
                    369:                        if(neg)s->out = 0377;
                    370:                        else s->out = ct-1;
                    371:                        neg = ct = 0;
                    372:                        s = w;
                    373:                } else {
                    374:                loop:   if (s->inp == c) {
                    375:                                s = s->nst;
                    376:                                ct++;
                    377:                                continue;
                    378:                        }
                    379:                        if (s->inp == 0) goto enter;
                    380:                        if (s->link == 0) {
                    381:                                if (smax >= &w[MAXSIZ - 1]) overflo();
                    382:                                s->link = ++smax;
                    383:                                s = smax;
                    384:                                goto enter;
                    385:                        }
                    386:                        s = s->link;
                    387:                        goto loop;
                    388:                }
                    389:        }
                    390: 
                    391:        enter:
                    392:        do {
                    393:                s->inp = c;
                    394:                ct++;
                    395:                if (smax >= &w[MAXSIZ - 1]) overflo();
                    396:                s->nst = ++smax;
                    397:                s = smax;
                    398:        } while ((c = getargc()) != '\n' && c!=EOF);
                    399:        if(neg)smax->out = 0377;
                    400:        else smax->out = ct-1;
                    401:        neg = ct = 0;
                    402:        s = w;
                    403:        if (c != EOF)
                    404:                goto nword;
                    405: }
                    406: 
                    407: overflo() {
                    408:        fprintf(stderr, "wordlist too large\n");
                    409:        exit(2);
                    410: }
                    411: cfail() {
                    412:        struct words *queue[QSIZE];
                    413:        struct words **front, **rear;
                    414:        struct words *state;
                    415:        int bstart;
                    416:        register char c;
                    417:        register struct words *s;
                    418:        s = w;
                    419:        front = rear = queue;
                    420: init:  if ((s->inp) != 0) {
                    421:                *rear++ = s->nst;
                    422:                if (rear >= &queue[QSIZE - 1]) overflo();
                    423:        }
                    424:        if ((s = s->link) != 0) {
                    425:                goto init;
                    426:        }
                    427: 
                    428:        while (rear!=front) {
                    429:                s = *front;
                    430:                if (front == &queue[QSIZE-1])
                    431:                        front = queue;
                    432:                else front++;
                    433:        cloop:  if ((c = s->inp) != 0) {
                    434:                        bstart=0;
                    435:                        *rear = (q = s->nst);
                    436:                        if (front < rear)
                    437:                                if (rear >= &queue[QSIZE-1])
                    438:                                        if (front == queue) overflo();
                    439:                                        else rear = queue;
                    440:                                else rear++;
                    441:                        else
                    442:                                if (++rear == front) overflo();
                    443:                        state = s->fail;
                    444:                floop:  if (state == 0){ state = w;bstart=1;}
                    445:                        if (state->inp == c) {
                    446:                        qloop:  q->fail = state->nst;
                    447:                                if ((state->nst)->out != 0 && q->out == 0) q->out = (state->nst)->out;
                    448:                                if((q=q->link) != 0)goto qloop;
                    449:                        }
                    450:                        else if ((state = state->link) != 0)
                    451:                                goto floop;
                    452:                        else if(bstart==0){state=0; goto floop;}
                    453:                }
                    454:                if ((s = s->link) != 0)
                    455:                        goto cloop;
                    456:        }
                    457: /*     for(s=w;s<=smax;s++)
                    458:                printf("s %d ch %c out %d nst %d link %d fail %d\n",s,
                    459:                        s->inp,s->out,s->nst,s->link,s->fail);
                    460: */
                    461: }
                    462: outc(addr,file)
                    463: char *addr;
                    464: char *file;
                    465: {
                    466:        int inside;
                    467: 
                    468:        inside = 0;
                    469:        if(!caps && lineno && linemsg){
                    470:                printf("beginning line %ld",olcount);
                    471:                if(file != (char *)NULL)printf(" %s\n",file);
                    472:                else printf("\n");
                    473:                linemsg = 0;
                    474:        }
                    475:        while(nlp < addr){
                    476:                if(!caps && oct > 60 && table[*nlp] == ' ' && nlp != begp && nlp != endp){
                    477:                        oct=0;
                    478:                        putchar('\n');
                    479:                }
                    480:                if(nlp == begp){
                    481:                        if(caps)inside++;
                    482:                        else {
                    483:                                if( oct >45){putchar('\n');
                    484:                                        oct=0;
                    485:                                }
                    486:                                if( oct==0 || table[*nlp] != ' '){
                    487:                                        printf("*[");
                    488:                                        oct+=2;
                    489:                                }
                    490:                                else {printf(" *[");;
                    491:                                        oct+=3;
                    492:                                }
                    493:                        }
                    494:                        if(mflg)putc('[',mine);
                    495:                }
                    496:                if(inside){
                    497:                        if(islower(*nlp))*nlp = toupper(*nlp);
                    498:                }
                    499:                else {
                    500:                        if(!caps && *nlp == '\n')*nlp = ' ';
                    501:                        if(*nlp == ' ' && oct==0);
                    502:                        else if(!caps) {putchar(*nlp); oct++;}
                    503:                }
                    504:                if(nlp == endp){
                    505:                        if(caps)
                    506:                                inside= 0;
                    507:                        else {
                    508:                                if(*(nlp) != ' '){printf("]*");
                    509:                                        oct+=2;
                    510:                                }
                    511:                                else {printf("]* ");
                    512:                                        oct+=3;
                    513:                                }
                    514:                                if(oct >60){putchar('\n');
                    515:                                        oct=0;
                    516:                                }
                    517:                        }
                    518:                        if(mflg)putc(']',mine);
                    519:                        beg = 0;
                    520:                }
                    521:                if(mflg){
                    522:                        if(nlp == myst)beg = 1;
                    523:                        if(beg || last){
                    524:                                putc(*nlp,mine);
                    525:                                if(myct++ >= 72 || last == 20){
                    526:                                        putc('\n',mine);
                    527:                                        if(last == 20)last=myct=0;
                    528:                                        else myct=0;
                    529:                                }
                    530:                                if(last)last++;
                    531:                        }
                    532:                }
                    533:                nlp++;
                    534:        }
                    535: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.