Annotation of researchv10no/cmd/diction/diction.c, revision 1.1.1.1

1.1       root        1: /*
                      2:  * diction -- print all sentences containing one of default phrases
                      3:  *
                      4:  *     status returns:
                      5:  *             0 - ok, and some matches
                      6:  *             1 - ok, but no matches
                      7:  *             2 - some error
                      8:  */
                      9: 
                     10: #include <stdio.h>
                     11: #include <ctype.h>
                     12: 
                     13: #define        MAXSIZ 6500
                     14: #define QSIZE 650
                     15: int linemsg;
                     16: long olcount;
                     17: long lcount;
                     18: struct words {
                     19:        char    inp;
                     20:        char    out;
                     21:        struct  words *nst;
                     22:        struct  words *link;
                     23:        struct  words *fail;
                     24: } w[MAXSIZ], *smax, *q;
                     25: 
                     26: char table[128] = {
                     27:        0, 0, 0, 0, 0, 0, 0, 0,
                     28:        0, 0, ' ', 0, 0, 0, 0, 0,
                     29:        0, 0, 0, 0, 0, 0, 0, 0,
                     30:        0, 0, 0, 0, 0, 0, 0, 0,
                     31:        ' ', '.', ' ', ' ', ' ', ' ', ' ', ' ',
                     32:        ' ', ' ', ' ', ' ', ' ', ' ', '.', ' ',
                     33:        '0', '1', '2', '3', '4', '5', '6', '7',
                     34:        '8', '9', ' ', ' ', ' ', ' ', ' ', '.',
                     35:        ' ', 'a', 'b', 'c', 'd', 'e', 'f', 'g',
                     36:        'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o',
                     37:        'p', 'q', 'r', 's', 't', 'u', 'v', 'w',
                     38:        'x', 'y', 'z', ' ', ' ', ' ', ' ', ' ',
                     39:        ' ', 'a', 'b', 'c', 'd', 'e', 'f', 'g',
                     40:        'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o',
                     41:        'p', 'q', 'r', 's', 't', 'u', 'v', 'w',
                     42:        'x', 'y', 'z', ' ', ' ', ' ', ' ', ' '
                     43:        };
                     44: int    caps = 0;
                     45: int    lineno = 0;
                     46: int fflag= 0;
                     47: int nflag      = 1; /*use default file*/
                     48: char *filename;
                     49: int    mflg    = 0;    /*don't catch output*/
                     50: int    nfile;
                     51: int    nsucc;
                     52: long nsent = 0;
                     53: long nhits = 0;
                     54: char *nlp;
                     55: char *begp, *endp;
                     56: int beg, last;
                     57: char *myst;
                     58: int myct = 0;
                     59: int oct = 0;
                     60: FILE   *wordf;
                     61: FILE *mine;
                     62: FILE *fl;
                     63: char *listn;
                     64: int list = 0;
                     65: char   *argptr;
                     66: long tl = 0;
                     67: long th = 0;
                     68: 
                     69: main(argc, argv)
                     70: char *argv[];
                     71: {
                     72:        int sv;
                     73:        char cc;
                     74:        while (--argc > 0 && (++argv)[0][0]=='-')
                     75:                switch (argv[0][1]) {
                     76: 
                     77:                case 'f':
                     78:                        fflag++;
                     79:                        filename = (++argv)[0];
                     80:                        argc--;
                     81:                        continue;
                     82: 
                     83:                case 'n':
                     84:                        nflag = 0;
                     85:                        continue;
                     86:                case 'd':
                     87:                        mflg=0;
                     88:                        continue;
                     89:                case 'c':
                     90:                        caps++;
                     91:                        continue;
                     92:                case 'l':
                     93:                        lineno++;
                     94:                        continue;
                     95:                case 'A':               /* for acro */
                     96:                        for(cc='A';cc<='Z';cc++)
                     97:                                table[cc] = cc;
                     98:                        continue;
                     99:                case 'o':               /*to put hits to file*/
                    100:                        listn = (++argv)[0];
                    101:                        argc--;
                    102:                        list++;
                    103:                        if((fl=fopen(listn,"a"))== NULL){
                    104:                                fprintf(stderr,"diction: can't open file %s\n",
                    105:                                        listn);
                    106:                                exit(2);
                    107:                        }
                    108:                        continue;
                    109:                default:
                    110:                        fprintf(stderr, "diction: unknown flag\n");
                    111:                        continue;
                    112:                }
                    113: out:
                    114:        if(nflag){
                    115:                wordf = fopen(DICT,"r");
                    116:                if(wordf == NULL){
                    117:                        fprintf(stderr,"diction: can't open default dictionary\n");
                    118:                        exit(2);
                    119:                }
                    120:        }
                    121:        else {
                    122:                wordf = fopen(filename,"r");
                    123:                if(wordf == NULL){
                    124:                        fprintf(stderr,"diction: can't open %s\n",filename);
                    125:                        exit(2);
                    126:                }
                    127:        }
                    128: 
                    129: #ifdef CATCH
                    130:        if(fopen(CATCH,"r") != NULL){
                    131:                if((mine=fopen(CATCH,"a"))==NULL)mflg=0;
                    132:                else mflg = 1;
                    133:        }
                    134: #else
                    135:        mflg = 0;
                    136: #endif
                    137: #ifdef MACS
                    138:        if(caps){
                    139:                printf(".so ");
                    140:                printf(MACS);
                    141:                printf("\n");
                    142:        }
                    143: #endif
                    144:        cgotofn();
                    145:        cfail();
                    146:        nfile = argc;
                    147:        if (argc<=0) {
                    148:                execute((char *)NULL);
                    149:        }
                    150:        else while (--argc >= 0) {
                    151:                execute(*argv);
                    152:                if(lineno){
                    153:                        printf("file %s: number of lines %ld number of phrases found %ld\n",
                    154:                                *argv, lcount-1, nhits);
                    155:                        tl += lcount-1;
                    156:                        th += nhits;
                    157:                        sv = lcount-1;
                    158:                        lcount = nhits = 0;
                    159:                }
                    160:                argv++;
                    161:        }
                    162:        if(mflg)fprintf(mine,"number of sentences %ld %ld number of hits %ld %ld\n",nsent,tl,nhits,th);
                    163:        if(!caps&& !lineno)printf("number of sentences %ld number of phrases found %ld\n",nsent,nhits);
                    164:        else if(tl != sv)
                    165:                 if(!caps)printf("totals: number of lines %ld number of phrases found %ld\n",tl,th);
                    166:        exit(nsucc == 0);
                    167: }
                    168: 
                    169: execute(file)
                    170: char *file;
                    171: {
                    172:        register char *p;
                    173:        register struct words *c;
                    174:        register ccount;
                    175:        int count1;
                    176:        char *beg1;
                    177:        struct words *savc;
                    178:        char *savp;
                    179:        int savct;
                    180:        int scr;
                    181:        char buf[1024];
                    182:        int f;
                    183:        int hit;
                    184:        last = 0;
                    185:        if (file) {
                    186:                if ((f = open(file, 0)) < 0) {
                    187:                        fprintf(stderr, "diction: can't open %s\n", file);
                    188:                        exit(2);
                    189:                }
                    190:        }
                    191:        else f = 0;
                    192:        lcount = olcount = 1;
                    193:        linemsg = 1;
                    194:        ccount = 0;
                    195:        count1 = -1;
                    196:        p = buf;
                    197:        nlp = p;
                    198:        c = w;
                    199:        oct = hit = 0;
                    200:        savc = (struct words *) 0;
                    201:        savp = (char *) 0;
                    202:        for (;;) {
                    203:                if(--ccount <= 0) {
                    204:                        if (p == &buf[1024]) p = buf;
                    205:                        if (p > &buf[512]) {
                    206:                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
                    207:                        }
                    208:                        else if ((ccount = read(f, p, 512)) <= 0) break;
                    209:                        if(caps && (count1 > 0))
                    210:                                fwrite(beg1,sizeof(*beg1),count1,stdout);
                    211:                        count1 = ccount;
                    212:                        beg1 = p;
                    213:                }
                    214:                if(p == &buf[1024])p=buf;
                    215:                nstate:
                    216:                        if (c->inp == table[*p]) {
                    217:                                c = c->nst;
                    218:                        }
                    219:                        else if (c->link != 0) {
                    220:                                c = c->link;
                    221:                                goto nstate;
                    222:                        }
                    223:                        else {
                    224:                                if(savp != 0){
                    225:                                        c=savc;
                    226:                                        p=savp;
                    227:                                        if(ccount > savct)ccount += savct;
                    228:                                        else ccount = savct;
                    229:                                        savc = (struct words *) 0;
                    230:                                        savp = (char *) 0;
                    231:                                        goto hadone;
                    232:                                }
                    233:                                c = c->fail;
                    234:                                if (c==0) {
                    235:                                        c = w;
                    236:                                        istate:
                    237:                                        if (c->inp == table[*p]) {
                    238:                                                c = c->nst;
                    239:                                        }
                    240:                                        else if (c->link != 0) {
                    241:                                                c = c->link;
                    242:                                                goto istate;
                    243:                                        }
                    244:                                }
                    245:                                else goto nstate;
                    246:                        }
                    247:                if(c->out){
                    248:                        if((c->inp == table[*(p+1)]) && (c->nst != 0)){
                    249:                                savp=p;
                    250:                                savc=c;
                    251:                                savct=ccount;
                    252:                                goto cont;
                    253:                        }
                    254:                        else if(c->link != 0){
                    255:                                savc=c;
                    256:                                while((savc=savc->link)!= 0){
                    257:                                        if(savc->inp == table[*(p+1)]){
                    258:                                                savp=p;
                    259:                                                savc=c;
                    260:                                                savct=ccount;
                    261:                                                goto cont;
                    262:                                        }
                    263:                                }
                    264:                        }
                    265:                hadone:
                    266:                        savc = (struct words *) 0;
                    267:                        savp = (char *) 0;
                    268:                        if(c->out == (char)(0377)){
                    269:                                c=w;
                    270:                                goto nstate;
                    271:                        }
                    272:                        begp = p - (c->out);
                    273:                        if(begp < &buf[0])begp = &buf[1024] - (&buf[0]-begp);
                    274:                        endp=p;
                    275:                        if(mflg){
                    276:                                if(begp-20 < &buf[0]){
                    277:                                        myst = &buf[1024]-20;
                    278:                                        if(nlp < &buf[512])myst=nlp;
                    279:                                }
                    280:                                else myst = begp-20;
                    281:                                if(myst < nlp)myst = nlp;
                    282:                                beg = 0;
                    283:                        }
                    284:                        hit = 1;
                    285:                        nhits++;
                    286:                        if(*p == '\n')lcount++;
                    287:                        if (table[*p++] == '.') {
                    288:                                linemsg = 1;
                    289:                                if (--ccount <= 0) {
                    290:                                        if (p == &buf[1024]) p = buf;
                    291:                                        if (p > &buf[512]) {
                    292:                                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
                    293:                                        }
                    294:                                        else if ((ccount = read(f, p, 512)) <= 0) break;
                    295:                                        if(caps && (count1 > 0))
                    296:                                                fwrite(beg1,sizeof(*beg1),count1,stdout);
                    297:                                        count1=ccount;
                    298:                                        beg1=p;
                    299:                                }
                    300:                        }
                    301:        succeed:        nsucc = 1;
                    302:                        {
                    303:                                if (p <= nlp) {
                    304:                                        outc(&buf[1024],file);
                    305:                                        nlp = buf;
                    306:                                }
                    307:                                outc(p,file);
                    308:                        }
                    309:                        if(mflg)last=1;
                    310:        nomatch:
                    311:                        nlp = p;
                    312:                        c = w;
                    313:                        begp = endp = 0;
                    314:                        continue;
                    315:                }
                    316:        cont:
                    317:                if(*p == '\n')lcount++;
                    318:                if (table[*p++] == '.'){
                    319:                                if(hit){
                    320:                                        if(p <= nlp){
                    321:                                                outc(&buf[1024],file);
                    322:                                                nlp = buf;
                    323:                                        }
                    324:                                        outc(p,file);
                    325:                                        if(!caps)printf("\n\n");
                    326:                                        if(mflg && last){putc('\n',mine);myct = 0;}
                    327:                                        }
                    328:                                linemsg = 1;
                    329:                                if(*p == '\n')olcount = lcount+1;
                    330:                                else
                    331:                                        olcount=lcount;
                    332:                                last = 0;
                    333:                                hit = 0;
                    334:                                oct = 0;
                    335:                                nlp = p;
                    336:                                c = w;
                    337:                                begp = endp = 0;
                    338:                                nsent++;
                    339:                        }
                    340:        }
                    341:        if(caps && (count1 > 0))
                    342:                fwrite(beg1,sizeof(*beg1),count1,stdout);
                    343:        close(f);
                    344: }
                    345: 
                    346: getargc()
                    347: {
                    348:        register c;
                    349:        if (wordf){
                    350:                if((c=getc(wordf))==EOF){
                    351:                        fclose(wordf);
                    352:                        if(nflag && fflag){
                    353:                                nflag=0;
                    354:                                wordf=fopen(filename,"r");
                    355:                                if(wordf == NULL){
                    356:                                        fprintf(stderr,"diction can't open %s\n",filename);
                    357:                                        exit(2);
                    358:                                }
                    359:                                return(getc(wordf));
                    360:                        }
                    361:                        else return(EOF);
                    362:                }
                    363:                else return(c);
                    364:        }
                    365:        if ((c = *argptr++) == '\0')
                    366:                return(EOF);
                    367:        return(c);
                    368: }
                    369: 
                    370: cgotofn() {
                    371:        register c;
                    372:        register struct words *s;
                    373:        register ct;
                    374:        int neg;
                    375: 
                    376:        s = smax = w;
                    377:        neg = ct = 0;
                    378: nword: for(;;) {
                    379:                c = getargc();
                    380:                if(c == '~'){
                    381:                        neg++;
                    382:                        c = getargc();
                    383:                }
                    384:                if (c==EOF)
                    385:                        return;
                    386:                if (c == '\n') {
                    387:                        if(neg)s->out = 0377;
                    388:                        else s->out = ct-1;
                    389:                        neg = ct = 0;
                    390:                        s = w;
                    391:                } else {
                    392:                loop:   if (s->inp == c) {
                    393:                                s = s->nst;
                    394:                                ct++;
                    395:                                continue;
                    396:                        }
                    397:                        if (s->inp == 0) goto enter;
                    398:                        if (s->link == 0) {
                    399:                                if (smax >= &w[MAXSIZ - 1]) overflo();
                    400:                                s->link = ++smax;
                    401:                                s = smax;
                    402:                                goto enter;
                    403:                        }
                    404:                        s = s->link;
                    405:                        goto loop;
                    406:                }
                    407:        }
                    408: 
                    409:        enter:
                    410:        do {
                    411:                s->inp = c;
                    412:                ct++;
                    413:                if (smax >= &w[MAXSIZ - 1]) overflo();
                    414:                s->nst = ++smax;
                    415:                s = smax;
                    416:        } while ((c = getargc()) != '\n' && c!=EOF);
                    417:        if(neg)smax->out = 0377;
                    418:        else smax->out = ct-1;
                    419:        neg = ct = 0;
                    420:        s = w;
                    421:        if (c != EOF)
                    422:                goto nword;
                    423: }
                    424: 
                    425: overflo() {
                    426:        fprintf(stderr, "wordlist too large\n");
                    427:        exit(2);
                    428: }
                    429: cfail() {
                    430:        struct words *queue[QSIZE];
                    431:        struct words **front, **rear;
                    432:        struct words *state;
                    433:        int bstart;
                    434:        register char c;
                    435:        register struct words *s;
                    436:        s = w;
                    437:        front = rear = queue;
                    438: init:  if ((s->inp) != 0) {
                    439:                *rear++ = s->nst;
                    440:                if (rear >= &queue[QSIZE - 1]) overflo();
                    441:        }
                    442:        if ((s = s->link) != 0) {
                    443:                goto init;
                    444:        }
                    445: 
                    446:        while (rear!=front) {
                    447:                s = *front;
                    448:                if (front == &queue[QSIZE-1])
                    449:                        front = queue;
                    450:                else front++;
                    451:        cloop:  if ((c = s->inp) != 0) {
                    452:                        bstart=0;
                    453:                        *rear = (q = s->nst);
                    454:                        if (front < rear)
                    455:                                if (rear >= &queue[QSIZE-1])
                    456:                                        if (front == queue) overflo();
                    457:                                        else rear = queue;
                    458:                                else rear++;
                    459:                        else
                    460:                                if (++rear == front) overflo();
                    461:                        state = s->fail;
                    462:                floop:  if (state == 0){ state = w;bstart=1;}
                    463:                        if (state->inp == c) {
                    464:                        qloop:  q->fail = state->nst;
                    465:                                if ((state->nst)->out != 0 && q->out == 0) q->out = (state->nst)->out;
                    466:                                if((q=q->link) != 0)goto qloop;
                    467:                        }
                    468:                        else if((state->link) != 0){
                    469:                                state = state->link;
                    470:                                goto floop;
                    471:                        }
                    472:                        else if((state = state->fail) != 0)
                    473:                                goto floop;
                    474:                        else if(bstart==0){state=0; goto floop;}
                    475:                }
                    476:                if ((s = s->link) != 0)
                    477:                        goto cloop;
                    478:        }
                    479: /*     for(s=w;s<=smax;s++)
                    480:                printf("s %d ch %c out %d nst %d link %d fail %d\n",s,
                    481:                        s->inp,s->out,s->nst,s->link,s->fail);
                    482: */
                    483: }
                    484: outc(addr,file)
                    485: char *addr;
                    486: char *file;
                    487: {
                    488:        static inside = 0;
                    489: 
                    490:        if(!caps && lineno && linemsg){
                    491:                printf("beginning line %ld",olcount);
                    492:                if(file != (char *)NULL)printf(" %s\n",file);
                    493:                else printf("\n");
                    494:                linemsg = 0;
                    495:        }
                    496:        while(nlp < addr){
                    497:                if(!caps && oct > 60 && table[*nlp] == ' ' && nlp != begp && nlp != endp){
                    498:                        oct=0;
                    499:                        putchar('\n');
                    500:                }
                    501:                if(nlp == begp){
                    502:                        if(caps)inside++;
                    503:                        else {
                    504:                                if(list)inside++;
                    505:                                if( oct >45){putchar('\n');
                    506:                                        oct=0;
                    507:                                }
                    508:                                if( oct==0 || table[*nlp] != ' '){
                    509:                                        printf("*[");
                    510:                                        oct+=2;
                    511:                                }
                    512:                                else {printf(" *[");;
                    513:                                        oct+=3;
                    514:                                }
                    515:                        }
                    516:                        if(mflg)putc('[',mine);
                    517:                }
                    518:                if(inside && caps){
                    519:                        if(islower(*nlp))*nlp = toupper(*nlp);
                    520:                }
                    521:                else {
                    522:                        if(inside && list)putc(table[*nlp],fl);
                    523:                        if(!caps && *nlp == '\n')*nlp = ' ';
                    524:                        if(*nlp == ' ' && oct==0);
                    525:                        else if(!caps) {putchar(*nlp); oct++;}
                    526:                }
                    527:                if(nlp == endp){
                    528:                        if(caps)
                    529:                                inside= 0;
                    530:                        else {
                    531:                                if(list && inside){
                    532:                                        inside = 0;
                    533:                                        putc('\n',fl);
                    534:                                }
                    535:                                if(*(nlp) != ' '){printf("]*");
                    536:                                        oct+=2;
                    537:                                }
                    538:                                else {printf("]* ");
                    539:                                        oct+=3;
                    540:                                }
                    541:                                if(oct >60){putchar('\n');
                    542:                                        oct=0;
                    543:                                }
                    544:                        }
                    545:                        if(mflg)putc(']',mine);
                    546:                        beg = 0;
                    547:                }
                    548:                if(mflg){
                    549:                        if(nlp == myst)beg = 1;
                    550:                        if(beg || last){
                    551:                                putc(*nlp,mine);
                    552:                                if(myct++ >= 72 || last == 20){
                    553:                                        putc('\n',mine);
                    554:                                        if(last == 20)last=myct=0;
                    555:                                        else myct=0;
                    556:                                }
                    557:                                if(last)last++;
                    558:                        }
                    559:                }
                    560:                nlp++;
                    561:        }
                    562: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.