Annotation of 40BSD/cmd/diction/diction.c, revision 1.1.1.1

1.1       root        1: /*
                      2: * diction -- print all sentences containing one of default phrases
                      3:  *
                      4:  *     status returns:
                      5:  *             0 - ok, and some matches
                      6:  *             1 - ok, but no matches
                      7:  *             2 - some error
                      8:  */
                      9: 
                     10: #include <stdio.h>
                     11: #include <ctype.h>
                     12: 
                     13: #define        MAXSIZ 6500
                     14: #define QSIZE 650
                     15: struct words {
                     16:        char    inp;
                     17:        char    out;
                     18:        struct  words *nst;
                     19:        struct  words *link;
                     20:        struct  words *fail;
                     21: } w[MAXSIZ], *smax, *q;
                     22: 
                     23: int fflag;
                     24: int nflag      = 1; /*use default file*/
                     25: char *filename;
                     26: int    nfile;
                     27: int    nsucc;
                     28: long nsent = 0;
                     29: long nhits = 0;
                     30: char *nlp;
                     31: char *begp, *endp;
                     32: int oct = 0;
                     33: FILE   *wordf;
                     34: char   *argptr;
                     35: 
                     36: main(argc, argv)
                     37: char **argv;
                     38: {
                     39:        while (--argc > 0 && (++argv)[0][0]=='-')
                     40:                switch (argv[0][1]) {
                     41: 
                     42:                case 'f':
                     43:                        fflag++;
                     44:                        filename = ++argv;
                     45:                        argc--;
                     46:                        continue;
                     47: 
                     48:                case 'n':
                     49:                        nflag = 0;
                     50:                        continue;
                     51:                case 'd':
                     52:                        continue;
                     53:                default:
                     54:                        fprintf(stderr, "diction: unknown flag\n");
                     55:                        continue;
                     56:                }
                     57: out:
                     58:        if(nflag){
                     59:                wordf = fopen(DICT,"r");
                     60:                if(wordf == NULL){
                     61:                        fprintf(stderr,"diction: can't open default dictionary\n");
                     62:                        exit(2);
                     63:                }
                     64:        }
                     65:        else {
                     66:                wordf = fopen(*filename,"r");
                     67:                if(wordf == NULL){
                     68:                        fprintf(stderr,"diction: can't open %s\n",filename);
                     69:                        exit(2);
                     70:                }
                     71:        }
                     72: 
                     73:        cgotofn();
                     74:        cfail();
                     75:        nfile = argc;
                     76:        if (argc<=0) {
                     77:                execute((char *)NULL);
                     78:        }
                     79:        else while (--argc >= 0) {
                     80:                execute(*argv);
                     81:                argv++;
                     82:        }
                     83:        printf("number of sentences %ld number of hits %ld\n",nsent,nhits);
                     84:        exit(nsucc == 0);
                     85: }
                     86: 
                     87: execute(file)
                     88: char *file;
                     89: {
                     90:        register char *p;
                     91:        register struct words *c;
                     92:        register ccount;
                     93:        struct words *savc;
                     94:        char *savp;
                     95:        int savct;
                     96:        int scr;
                     97:        char buf[1024];
                     98:        int f;
                     99:        int hit;
                    100:        if (file) {
                    101:                if ((f = open(file, 0)) < 0) {
                    102:                        fprintf(stderr, "diction: can't open %s\n", file);
                    103:                        exit(2);
                    104:                }
                    105:        }
                    106:        else f = 0;
                    107:        ccount = 0;
                    108:        p = buf;
                    109:        nlp = p;
                    110:        c = w;
                    111:        oct = hit = 0;
                    112:        savc = savp = 0;
                    113:        for (;;) {
                    114:                if (--ccount <= 0) {
                    115:                        if (p == &buf[1024]) p = buf;
                    116:                        if (p > &buf[512]) {
                    117:                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
                    118:                        }
                    119:                        else if ((ccount = read(f, p, 512)) <= 0) break;
                    120:                        convert(p,ccount);
                    121:                }
                    122:                if(p == &buf[1024])p=buf;
                    123:                nstate:
                    124:                        if (c->inp == *p) {
                    125:                                c = c->nst;
                    126:                        }
                    127:                        else if (c->link != 0) {
                    128:                                c = c->link;
                    129:                                goto nstate;
                    130:                        }
                    131:                        else {
                    132:                                if(savp != 0){
                    133:                                        c=savc;
                    134:                                        p=savp;
                    135:                                        if(ccount > savct)ccount += savct;
                    136:                                        else ccount = savct;
                    137:                                        savc=savp=0;
                    138:                                        goto hadone;
                    139:                                }
                    140:                                c = c->fail;
                    141:                                if (c==0) {
                    142:                                        c = w;
                    143:                                        istate:
                    144:                                        if (c->inp == *p) {
                    145:                                                c = c->nst;
                    146:                                        }
                    147:                                        else if (c->link != 0) {
                    148:                                                c = c->link;
                    149:                                                goto istate;
                    150:                                        }
                    151:                                }
                    152:                                else goto nstate;
                    153:                        }
                    154:                if(c->out){
                    155:                        if((c->inp == *(p+1)) && (c->nst != 0)){
                    156:                                savp=p;
                    157:                                savc=c;
                    158:                                savct=ccount;
                    159:                                goto cont;
                    160:                        }
                    161:                        else if(c->link != 0){
                    162:                                savc=c;
                    163:                                while((savc=savc->link)!= 0){
                    164:                                        if(savc->inp == *(p+1)){
                    165:                                                savp=p;
                    166:                                                savc=c;
                    167:                                                savct=ccount;
                    168:                                                goto cont;
                    169:                                        }
                    170:                                }
                    171:                        }
                    172:                hadone:
                    173:                        savc=savp=0;
                    174:                        if(c->out == (char)(0377)){
                    175:                                c=w;
                    176:                                goto nstate;
                    177:                        }
                    178:                        begp = p - (c->out);
                    179:                        if(begp < &buf[0])begp = &buf[1024] - (&buf[0]-begp);
                    180:                        endp=p;
                    181:                        hit = 1;
                    182:                        nhits++;
                    183:                        if (*p++ == '.') {
                    184:                                if (--ccount <= 0) {
                    185:                                        if (p == &buf[1024]) p = buf;
                    186:                                        if (p > &buf[512]) {
                    187:                                                if ((ccount = read(f, p, &buf[1024] - p)) <= 0) break;
                    188:                                        }
                    189:                                        else if ((ccount = read(f, p, 512)) <= 0) break;
                    190:                                        convert(p,ccount);
                    191:                                }
                    192:                        }
                    193:        succeed:        nsucc = 1;
                    194:                        {
                    195:                                if (p <= nlp) {
                    196:                                        outc(&buf[1024]);
                    197:                                        nlp = buf;
                    198:                                }
                    199:                                outc(p);
                    200:                        }
                    201:        nomatch:
                    202:                        nlp = p;
                    203:                        c = w;
                    204:                        begp = endp = 0;
                    205:                        continue;
                    206:                }
                    207:        cont:
                    208:                if (*p++ == '.'){
                    209:                                if(hit){
                    210:                                        if(p <= nlp){
                    211:                                                outc(&buf[1024]);
                    212:                                                nlp = buf;
                    213:                                        }
                    214:                                        outc(p);
                    215:                                        putchar('\n'); putchar('\n');
                    216:                                        }
                    217:                                hit = 0;
                    218:                                oct = 0;
                    219:                                nlp = p;
                    220:                                c = w;
                    221:                                begp = endp = 0;
                    222:                        }
                    223:        }
                    224:        close(f);
                    225: }
                    226: 
                    227: getargc()
                    228: {
                    229:        register c;
                    230:        if (wordf){
                    231:                if((c=getc(wordf))==EOF){
                    232:                        fclose(wordf);
                    233:                        if(nflag && fflag){
                    234:                                nflag=0;
                    235:                                wordf=fopen(*filename,"r");
                    236:                                if(wordf == NULL){
                    237:                                        fprintf("can't open %s\n",filename);
                    238:                                        exit(2);
                    239:                                }
                    240:                                return(getc(wordf));
                    241:                        }
                    242:                        else return(EOF);
                    243:                }
                    244:                else return(c);
                    245:        }
                    246:        if ((c = *argptr++) == '\0')
                    247:                return(EOF);
                    248:        return(c);
                    249: }
                    250: 
                    251: cgotofn() {
                    252:        register c;
                    253:        register struct words *s;
                    254:        register ct;
                    255:        int neg;
                    256: 
                    257:        s = smax = w;
                    258:        neg = ct = 0;
                    259: nword: for(;;) {
                    260:                c = getargc();
                    261:                if(c == '~'){
                    262:                        neg++;
                    263:                        c = getargc();
                    264:                }
                    265:                if (c==EOF)
                    266:                        return;
                    267:                if (c == '\n') {
                    268:                        if(neg)s->out = 0377;
                    269:                        else s->out = ct-1;
                    270:                        neg = ct = 0;
                    271:                        s = w;
                    272:                } else {
                    273:                loop:   if (s->inp == c) {
                    274:                                s = s->nst;
                    275:                                ct++;
                    276:                                continue;
                    277:                        }
                    278:                        if (s->inp == 0) goto enter;
                    279:                        if (s->link == 0) {
                    280:                                if (smax >= &w[MAXSIZ - 1]) overflo();
                    281:                                s->link = ++smax;
                    282:                                s = smax;
                    283:                                goto enter;
                    284:                        }
                    285:                        s = s->link;
                    286:                        goto loop;
                    287:                }
                    288:        }
                    289: 
                    290:        enter:
                    291:        do {
                    292:                s->inp = c;
                    293:                ct++;
                    294:                if (smax >= &w[MAXSIZ - 1]) overflo();
                    295:                s->nst = ++smax;
                    296:                s = smax;
                    297:        } while ((c = getargc()) != '\n' && c!=EOF);
                    298:        if(neg)smax->out = 0377;
                    299:        else smax->out = ct-1;
                    300:        neg = ct = 0;
                    301:        s = w;
                    302:        if (c != EOF)
                    303:                goto nword;
                    304: }
                    305: 
                    306: overflo() {
                    307:        fprintf(stderr, "wordlist too large\n");
                    308:        exit(2);
                    309: }
                    310: cfail() {
                    311:        struct words *queue[QSIZE];
                    312:        struct words **front, **rear;
                    313:        struct words *state;
                    314:        int bstart;
                    315:        register char c;
                    316:        register struct words *s;
                    317:        s = w;
                    318:        front = rear = queue;
                    319: init:  if ((s->inp) != 0) {
                    320:                *rear++ = s->nst;
                    321:                if (rear >= &queue[QSIZE - 1]) overflo();
                    322:        }
                    323:        if ((s = s->link) != 0) {
                    324:                goto init;
                    325:        }
                    326: 
                    327:        while (rear!=front) {
                    328:                s = *front;
                    329:                if (front == &queue[QSIZE-1])
                    330:                        front = queue;
                    331:                else front++;
                    332:        cloop:  if ((c = s->inp) != 0) {
                    333:                        bstart=0;
                    334:                        *rear = (q = s->nst);
                    335:                        if (front < rear)
                    336:                                if (rear >= &queue[QSIZE-1])
                    337:                                        if (front == queue) overflo();
                    338:                                        else rear = queue;
                    339:                                else rear++;
                    340:                        else
                    341:                                if (++rear == front) overflo();
                    342:                        state = s->fail;
                    343:                floop:  if (state == 0){ state = w;bstart=1;}
                    344:                        if (state->inp == c) {
                    345:                        qloop:  q->fail = state->nst;
                    346:                                if ((state->nst)->out != 0 && q->out == 0) q->out = (state->nst)->out;
                    347:                                if((q=q->link) != 0)goto qloop;
                    348:                        }
                    349:                        else if ((state = state->link) != 0)
                    350:                                goto floop;
                    351:                        else if(bstart==0){state=0; goto floop;}
                    352:                }
                    353:                if ((s = s->link) != 0)
                    354:                        goto cloop;
                    355:        }
                    356: /*     for(s=w;s<=smax;s++)
                    357:                printf("s %d ch %c out %d nst %d link %d fail %d\n",s,
                    358:                        s->inp,s->out,s->nst,s->link,s->fail);
                    359: */
                    360: }
                    361: convert(p,ccount)
                    362: char *p;
                    363: {
                    364:        int ct;
                    365:        char *pt;
                    366:        for(pt=p,ct=ccount;--ct>=0;pt++){
                    367:                if(isupper(*pt))*pt=tolower(*pt);
                    368:                else if(isspace(*pt))*pt=' ';
                    369:                else if(*pt=='.' || *pt=='?'||*pt=='!'){
                    370:                        *pt='.';
                    371:                        nsent++;
                    372:                }
                    373:                else if(ispunct(*pt))*pt=' ';
                    374:        }
                    375: }
                    376: outc(addr)
                    377: char *addr;
                    378: {
                    379: 
                    380:        while(nlp < addr){
                    381:                if(oct++ > 70 && *nlp == ' ' && nlp != begp && nlp != endp){
                    382:                        oct=0;
                    383:                        putchar('\n');
                    384:                }
                    385:                if(nlp == begp){
                    386:                        putchar('[');
                    387:                }
                    388:                putchar(*nlp);
                    389:                if(nlp == endp){
                    390:                        putchar(']');
                    391:                }
                    392:                nlp++;
                    393:        }
                    394: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.