Annotation of 43BSDReno/contrib/jove/re.c, revision 1.1.1.1

1.1       root        1: /***************************************************************************
                      2:  * This program is Copyright (C) 1986, 1987, 1988 by Jonathan Payne.  JOVE *
                      3:  * is provided to you without charge, and with no warranty.  You may give  *
                      4:  * away copies of JOVE, including sources, provided that this notice is    *
                      5:  * included in all the files.                                              *
                      6:  ***************************************************************************/
                      7: 
                      8: /* search package */
                      9: 
                     10: #include "jove.h"
                     11: #include "re.h"
                     12: #include "ctype.h"
                     13: 
                     14: private char *insert proto((char *, char *, int));
                     15: 
                     16: private void
                     17:        REreset proto((void)),
                     18:        search proto((int, int, int));
                     19: private int
                     20:        backref proto((int, char *)),
                     21:        do_comp proto((struct RE_block *,int)),
                     22:        member proto((char *, int, int)),
                     23:        REgetc proto((void)),
                     24:        REmatch proto((char *, char *));
                     25: 
                     26: char   searchstr[128],         /* global search string */
                     27:        rep_search[128],        /* replace search string */
                     28:        rep_str[128];           /* contains replacement string */
                     29: 
                     30: int    REdirection;            /* current direction we're searching in */
                     31: 
                     32: int    CaseIgnore = 0,         /* ignore case? */
                     33:        WrapScan = 0,           /* wrap at end of buffer? */
                     34:        UseRE = 0;              /* use regular expressions */
                     35: 
                     36: #define cind_cmp(a, b) (CaseEquiv[a] == CaseEquiv[b])
                     37: 
                     38: private int    REpeekc;
                     39: private char   *REptr;
                     40: 
                     41: private int
                     42: REgetc()
                     43: {
                     44:        int     c;
                     45: 
                     46:        if ((c = REpeekc) != -1)
                     47:                REpeekc = -1;
                     48:        else if (*REptr)
                     49:                c = *REptr++;
                     50:        else
                     51:                c = 0;
                     52: 
                     53:        return c;
                     54: }
                     55: 
                     56: #define STAR   01      /* Match any number of last RE. */
                     57: #define AT_BOL 2       /* ^ */
                     58: #define AT_EOL 4       /* $ */
                     59: #define AT_BOW 6       /* \< */
                     60: #define AT_EOW 8       /* \> */
                     61: #define OPENP  10      /* \( */
                     62: #define CLOSEP 12      /* \) */
                     63: #define CURLYB 14      /* \{ */
                     64: 
                     65: #define NOSTR  14      /* Codes <= NOSTR can't be *'d. */
                     66: 
                     67: #define ANYC   (NOSTR+2)               /* . */
                     68: #define NORMC  (ANYC+2)                /* normal character */
                     69: #define CINDC  (NORMC+2)               /* case independent character */
                     70: #define ONE_OF (CINDC+2)               /* [xxx] */
                     71: #define NONE_OF        (ONE_OF+2)      /* [^xxx] */
                     72: #define BACKREF        (NONE_OF+2)     /* \# */
                     73: #define EOP    (BACKREF+2)     /* end of pattern */
                     74: 
                     75: /* ONE_OF/NONE_OF is represented as a bit vector.
                     76:  * These symbols parameterize the representation.
                     77:  */
                     78: 
                     79: #define        BYTESIZE        8
                     80: #define        SETSIZE         (NCHARS / BYTESIZE)
                     81: #define        SETBYTE(c)      ((c) / BYTESIZE)
                     82: #define        SETBIT(c)       (1 << ((c) % BYTESIZE))
                     83: 
                     84: #define NPAR   10      /* [0-9] - 0th is the entire matched string, i.e. & */
                     85: private char   *comp_ptr,
                     86:                **alt_p,
                     87:                **alt_endp;
                     88: 
                     89: void
                     90: REcompile(pattern, re, re_blk)
                     91: char   *pattern;
                     92: int    re;
                     93: struct RE_block        *re_blk;
                     94: {
                     95:        REptr = pattern;
                     96:        REpeekc = -1;
                     97:        comp_ptr = re_blk->r_compbuf;
                     98:        alt_p = re_blk->r_alternates;
                     99:        alt_endp = alt_p + NALTS;
                    100:        *alt_p++ = comp_ptr;
                    101:        re_blk->r_nparens = 0;
                    102:        (void) do_comp(re_blk, re ? OKAY_RE : NORM);
                    103:        *alt_p = NULL;
                    104: 
                    105:        re_blk->r_anchored = NO;
                    106:        re_blk->r_firstc = '\0';
                    107:        /* do a little post processing */
                    108:        if (re_blk->r_alternates[1] == NULL) {
                    109:                char    *p;
                    110: 
                    111:                p = re_blk->r_alternates[0];
                    112:                for (;;) {
                    113:                        switch (*p) {
                    114:                        case OPENP:
                    115:                        case CLOSEP:
                    116:                                p += 2;
                    117:                                continue;
                    118: 
                    119:                        case AT_BOW:
                    120:                        case AT_EOW:
                    121:                                p += 1;
                    122:                                continue;
                    123: 
                    124:                        case AT_BOL:
                    125:                                re_blk->r_anchored = YES;
                    126:                                /* don't set firstc -- won't work */
                    127:                                break;
                    128: 
                    129:                        case NORMC:
                    130:                        case CINDC:
                    131:                                re_blk->r_firstc = CaseEquiv[p[2]];
                    132:                                break;
                    133: 
                    134:                        default:
                    135:                                break;
                    136:                        }
                    137:                        break;
                    138:                }
                    139:        }
                    140: }
                    141: 
                    142: /* compile the pattern into an internal code */
                    143: 
                    144: private int
                    145: do_comp(re_blk, kind)
                    146: struct RE_block        *re_blk;
                    147: int    kind;
                    148: {
                    149:        char    *this_verb,
                    150:                *prev_verb,
                    151:                *start_p,
                    152:                *comp_endp;
                    153:        int     parens[NPAR],
                    154:                *parenp,
                    155:                c,
                    156:                ret_code;
                    157: 
                    158:        parenp = parens;
                    159:        this_verb = NULL;
                    160:        ret_code = 1;
                    161:        comp_endp = &re_blk->r_compbuf[COMPSIZE - 6];
                    162: 
                    163:        /* wrap the whole expression around (implied) parens */
                    164:        if (kind == OKAY_RE) {
                    165:                *comp_ptr++ = OPENP;
                    166:                *comp_ptr++ = re_blk->r_nparens;
                    167:                *parenp++ = re_blk->r_nparens++;
                    168:        }
                    169: 
                    170:        start_p = comp_ptr;
                    171: 
                    172:        while ((c = REgetc()) != '\0') {
                    173:                if (comp_ptr > comp_endp)
                    174: toolong:               complain("Search string too long/complex.");
                    175:                prev_verb = this_verb;
                    176:                this_verb = comp_ptr;
                    177: 
                    178:                if (kind == NORM && strchr(".[*", c) != 0)
                    179:                        goto defchar;
                    180:                switch (c) {
                    181:                case '\\':
                    182:                        switch (c = REgetc()) {
                    183:                        case 0:
                    184:                                complain("[Premature end of pattern]");
                    185:                                /*NOTREACHED*/
                    186: 
                    187:                        case '{':
                    188:                            {
                    189:                                char    *wcntp;         /* word count */
                    190: 
                    191:                                *comp_ptr++ = CURLYB;
                    192:                                wcntp = comp_ptr;
                    193:                                *comp_ptr++ = 0;
                    194:                                for (;;) {
                    195:                                        int     comp_val;
                    196:                                        char    *comp_len;
                    197: 
                    198:                                        comp_len = comp_ptr++;
                    199:                                        comp_val = do_comp(re_blk, IN_CB);
                    200:                                        *comp_len = comp_ptr - comp_len;
                    201:                                        (*wcntp) += 1;
                    202:                                        if (comp_val == 0)
                    203:                                                break;
                    204:                                }
                    205:                                break;
                    206:                            }
                    207: 
                    208:                        case '}':
                    209:                                if (kind != IN_CB)
                    210:                                        complain("Unexpected \\}.");
                    211:                                ret_code = 0;
                    212:                                goto outahere;
                    213: 
                    214:                        case '(':
                    215:                                if (re_blk->r_nparens >= NPAR)
                    216:                                        complain("Too many ('s; max is %d.", NPAR);
                    217:                                *comp_ptr++ = OPENP;
                    218:                                *comp_ptr++ = re_blk->r_nparens;
                    219:                                *parenp++ = re_blk->r_nparens++;
                    220:                                break;
                    221: 
                    222:                        case ')':
                    223:                                if (parenp == parens)
                    224:                                        complain("Too many )'s.");
                    225:                                *comp_ptr++ = CLOSEP;
                    226:                                *comp_ptr++ = *--parenp;
                    227:                                break;
                    228: 
                    229:                        case '|':
                    230:                                if (alt_p >= alt_endp)
                    231:                                        complain("Too many alternates; max %d.", NALTS);
                    232:                                /* close off previous alternate */
                    233:                                *comp_ptr++ = CLOSEP;
                    234:                                *comp_ptr++ = *--parenp;
                    235:                                *comp_ptr++ = EOP;
                    236:                                *alt_p++ = comp_ptr;
                    237: 
                    238:                                /* start a new one */
                    239:                                re_blk->r_nparens = 0;
                    240:                                *comp_ptr++ = OPENP;
                    241:                                *comp_ptr++ = re_blk->r_nparens;
                    242:                                *parenp++ = re_blk->r_nparens++;
                    243:                                start_p = comp_ptr;
                    244:                                break;
                    245: 
                    246:                        case '1':
                    247:                        case '2':
                    248:                        case '3':
                    249:                        case '4':
                    250:                        case '5':
                    251:                        case '6':
                    252:                        case '7':
                    253:                        case '8':
                    254:                        case '9':
                    255:                                *comp_ptr++ = BACKREF;
                    256:                                *comp_ptr++ = c - '0';
                    257:                                break;
                    258: 
                    259:                        case '<':
                    260:                                *comp_ptr++ = AT_BOW;
                    261:                                break;
                    262: 
                    263:                        case '>':
                    264:                                *comp_ptr++ = AT_EOW;
                    265:                                break;
                    266: 
                    267:                        default:
                    268:                                goto defchar;
                    269:                        }
                    270:                        break;
                    271: 
                    272:                case ',':
                    273:                        if (kind != IN_CB)
                    274:                                goto defchar;
                    275:                        goto outahere;
                    276: 
                    277:                case '.':
                    278:                        *comp_ptr++ = ANYC;
                    279:                        break;
                    280: 
                    281:                case '^':
                    282:                        if (comp_ptr == start_p) {
                    283:                                *comp_ptr++ = AT_BOL;
                    284:                                break;
                    285:                        }
                    286:                        goto defchar;
                    287: 
                    288:                case '$':
                    289:                        if ((REpeekc = REgetc()) != 0 && REpeekc != '\\')
                    290:                                goto defchar;
                    291:                        *comp_ptr++ = AT_EOL;
                    292:                        break;
                    293: 
                    294:                case '[':
                    295:                    {
                    296:                        int     chrcnt;
                    297: 
                    298:                        *comp_ptr++ = ONE_OF;
                    299:                        if (comp_ptr + SETSIZE >= comp_endp)
                    300:                                goto toolong;
                    301:                        byte_zero(comp_ptr, (size_t) SETSIZE);
                    302:                        if ((REpeekc = REgetc()) == '^') {
                    303:                                *this_verb = NONE_OF;
                    304:                                /* Get it for real this time. */
                    305:                                (void) REgetc();
                    306:                        }
                    307:                        chrcnt = 0;
                    308:                        while ((c = REgetc()) != ']' && c != 0) {
                    309:                                if (c == '\\') {
                    310:                                        c = REgetc();
                    311:                                        if (c == 0)
                    312:                                                break;
                    313:                                } else if ((REpeekc = REgetc()) == '-') {
                    314:                                        int     i;
                    315: 
                    316:                                        i = c;
                    317:                                        (void) REgetc();     /* reread '-' */
                    318:                                        c = REgetc();
                    319:                                        if (c == 0)
                    320:                                                break;
                    321:                                        while (i < c) {
                    322:                                                comp_ptr[SETBYTE(i)] |= SETBIT(i);
                    323:                                                i += 1;
                    324:                                        }
                    325:                                }
                    326:                                comp_ptr[SETBYTE(c)] |= SETBIT(c);
                    327:                                chrcnt += 1;
                    328:                        }
                    329:                        if (c == 0)
                    330:                                complain("Missing ].");
                    331:                        if (chrcnt == 0)
                    332:                                complain("Empty [].");
                    333:                        comp_ptr += SETSIZE;
                    334:                        break;
                    335:                    }
                    336: 
                    337:                case '*':
                    338:                        if (prev_verb == NULL || *prev_verb <= NOSTR || (*prev_verb&STAR)!=0)
                    339:                                goto defchar;
                    340: 
                    341:                        if (*prev_verb == NORMC || *prev_verb == CINDC) {
                    342:                                char    lastc = comp_ptr[-1];
                    343: 
                    344:                                /* The * operator applies only to the
                    345:                                 * previous character.  Since we were
                    346:                                 * building a string-matching command
                    347:                                 * (NORMC or CINDC), we must split it
                    348:                                 * up and work with the last character.
                    349:                                 *
                    350:                                 * Note that the STARed versions of these
                    351:                                 * commands do not operate on strings, and
                    352:                                 * so do not need or have character counts.
                    353:                                 */
                    354: 
                    355:                                if (prev_verb[1] == 1) {
                    356:                                        /* Only one char in string:
                    357:                                         * delete old command.
                    358:                                         */
                    359:                                        this_verb = prev_verb;
                    360:                                } else {
                    361:                                        /* Several chars in string:
                    362:                                         * strip off the last.
                    363:                                         * New verb is derived from old.
                    364:                                         */
                    365:                                        prev_verb[1] -= 1;
                    366:                                        this_verb -= 1;
                    367:                                        *this_verb = *prev_verb;
                    368:                                }
                    369:                                comp_ptr = this_verb + 1;
                    370:                                *comp_ptr++ = lastc;
                    371:                        } else {
                    372:                                /* This command is just the previous one,
                    373:                                 * whose verb we will modify.
                    374:                                 */
                    375:                                this_verb = prev_verb;
                    376:                        }
                    377:                        *this_verb |= STAR;
                    378:                        break;
                    379:                default:
                    380: defchar:
                    381:                        if ((prev_verb == NULL) ||
                    382:                            !(*prev_verb == NORMC || *prev_verb == CINDC)) {
                    383:                                /* create new string command */
                    384:                                *comp_ptr++ = (CaseIgnore) ? CINDC : NORMC;
                    385:                                *comp_ptr++ = 0;
                    386:                        } else {
                    387:                                /* merge this into previous string command */
                    388:                                this_verb = prev_verb;
                    389:                        }
                    390:                        this_verb[1] += 1;
                    391:                        *comp_ptr++ = c;
                    392:                        break;
                    393:                }
                    394:        }
                    395: outahere:
                    396: 
                    397:        /* End of pattern, let's do some error checking. */
                    398:        if (kind == OKAY_RE) {
                    399:                *comp_ptr++ = CLOSEP;
                    400:                *comp_ptr++ = *--parenp;
                    401:        }
                    402:        if (parenp != parens)
                    403:                complain("Unmatched ()'s.");
                    404:        if (kind == IN_CB && c == 0)    /* end of pattern with missing \}. */
                    405:                complain("Missing \\}.");
                    406:        *comp_ptr++ = EOP;
                    407: 
                    408:        return ret_code;
                    409: }
                    410: 
                    411: private char   *pstrtlst[NPAR],        /* index into re_blk->r_lbuf */
                    412:                *pendlst[NPAR],
                    413:                *REbolp,        /* begining-of-line pointer */
                    414:                *locrater,      /* roof of last substitution */
                    415:                *loc1,  /* start of matched text */
                    416:                *loc2;  /* roof of matched text */
                    417: 
                    418: int    REbom,          /* beginning and end columns of match */
                    419:        REeom,
                    420:        REdelta;        /* increase in line length due to last re_dosub */
                    421: 
                    422: private int
                    423: backref(n, linep)
                    424: int    n;
                    425: register char  *linep;
                    426: {
                    427:        register char   *backsp,
                    428:                        *backep;
                    429: 
                    430:        backsp = pstrtlst[n];
                    431:        backep = pendlst[n];
                    432:        while (*backsp++ == *linep++)
                    433:                if (backsp >= backep)
                    434:                        return 1;
                    435:        return 0;
                    436: }
                    437: 
                    438: private int
                    439: member(comp_ptr, c, af)
                    440: register char  *comp_ptr;
                    441: register int   c,
                    442:                af;
                    443: {
                    444:        if (c == 0)
                    445:                return 0;       /* try to match EOL always fails */
                    446:        if (comp_ptr[SETBYTE(c)] & SETBIT(c))
                    447:                return af;
                    448:        return !af;
                    449: }
                    450: 
                    451: private int
                    452: REmatch(linep, comp_ptr)
                    453: register char  *linep,
                    454:                *comp_ptr;
                    455: {
                    456:        char    *first_p;
                    457:        register int    n;
                    458: 
                    459:        for (;;) switch (*comp_ptr++) {
                    460:        case NORMC:
                    461:                n = *comp_ptr++;
                    462:                while (--n >= 0)
                    463:                        if (*linep++ != *comp_ptr++)
                    464:                                return NO;
                    465:                continue;
                    466: 
                    467:        case CINDC:     /* case independent comparison */
                    468:                n = *comp_ptr++;
                    469:                while (--n >= 0)
                    470:                        if (!cind_cmp(*linep++, *comp_ptr++))
                    471:                                return NO;
                    472:                continue;
                    473: 
                    474:        case EOP:
                    475:                loc2 = linep;
                    476:                REeom = (loc2 - REbolp);
                    477:                return YES;     /* Success! */
                    478: 
                    479:        case AT_BOL:
                    480:                if (linep == REbolp && linep != locrater)
                    481:                        continue;
                    482:                return NO;
                    483: 
                    484:        case AT_EOL:
                    485:                if (*linep == '\0')
                    486:                        continue;
                    487:                return NO;
                    488: 
                    489:        case ANYC:
                    490:                if (*linep++ != 0)
                    491:                        continue;
                    492:                return NO;
                    493: 
                    494:        case AT_BOW:
                    495:                if (linep != locrater && ismword(*linep)
                    496:                && (linep == REbolp || !ismword(linep[-1])))
                    497:                        continue;
                    498:                return NO;
                    499: 
                    500:        case AT_EOW:
                    501:                if (linep != locrater && (*linep == 0 || !ismword(*linep)) &&
                    502:                    (linep != REbolp && ismword(linep[-1])))
                    503:                        continue;
                    504:                return NO;
                    505: 
                    506:        case ONE_OF:
                    507:        case NONE_OF:
                    508:                if (member(comp_ptr, *linep++, comp_ptr[-1] == ONE_OF)) {
                    509:                        comp_ptr += SETSIZE;
                    510:                        continue;
                    511:                }
                    512:                return NO;
                    513: 
                    514:        case OPENP:
                    515:                pstrtlst[*comp_ptr++] = linep;
                    516:                continue;
                    517: 
                    518:        case CLOSEP:
                    519:                pendlst[*comp_ptr++] = linep;
                    520:                continue;
                    521: 
                    522:        case BACKREF:
                    523:                if (pstrtlst[n = *comp_ptr++] == 0) {
                    524:                        s_mess("\\%d was not specified.", n + 1);
                    525:                        return NO;
                    526:                }
                    527:                if (backref(n, linep)) {
                    528:                        linep += pendlst[n] - pstrtlst[n];
                    529:                        continue;
                    530:                }
                    531:                return NO;
                    532: 
                    533:        case CURLYB:
                    534:            {
                    535:                int     wcnt,
                    536:                        any;
                    537: 
                    538:                wcnt = *comp_ptr++;
                    539:                any = 0;
                    540: 
                    541:                while (--wcnt >= 0) {
                    542:                        if (any == 0)
                    543:                                any = REmatch(linep, comp_ptr + 1);
                    544:                        comp_ptr += *comp_ptr;
                    545:                }
                    546:                if (any == 0)
                    547:                        return NO;
                    548:                linep = loc2;
                    549:                continue;
                    550:            }
                    551: 
                    552:        case ANYC | STAR:
                    553:                first_p = linep;
                    554:                while (*linep++)
                    555:                        ;
                    556:                goto star;
                    557: 
                    558:        case NORMC | STAR:
                    559:                first_p = linep;
                    560:                while (*comp_ptr == *linep++)
                    561:                        ;
                    562:                comp_ptr += 1;
                    563:                goto star;
                    564: 
                    565:        case CINDC | STAR:
                    566:                first_p = linep;
                    567:                while (cind_cmp(*comp_ptr, *linep++))
                    568:                        ;
                    569:                comp_ptr += 1;
                    570:                goto star;
                    571: 
                    572:        case ONE_OF | STAR:
                    573:        case NONE_OF | STAR:
                    574:                first_p = linep;
                    575:                while (member(comp_ptr, *linep++, comp_ptr[-1] == (ONE_OF | STAR)))
                    576:                        ;
                    577:                comp_ptr += SETSIZE;
                    578:                /* fall through */
                    579: star:
                    580:                /* linep points *after* first unmatched char.
                    581:                 * first_p points at where starred element started matching.
                    582:                 */
                    583:                while (--linep > first_p) {
                    584:                        if ((*comp_ptr != NORMC || *linep == comp_ptr[2]) &&
                    585:                            REmatch(linep, comp_ptr))
                    586:                                return YES;
                    587:                }
                    588:                continue;
                    589: 
                    590:        case BACKREF | STAR:
                    591:                first_p = linep;
                    592:                n = *comp_ptr++;
                    593:                while (backref(n, linep))
                    594:                        linep += pendlst[n] - pstrtlst[n];
                    595:                while (linep > first_p) {
                    596:                        if (REmatch(linep, comp_ptr))
                    597:                                return YES;
                    598:                        linep -= pendlst[n] - pstrtlst[n];
                    599:                }
                    600:                continue;
                    601: 
                    602:        default:
                    603:                complain("RE error match (%d).", comp_ptr[-1]);
                    604:        }
                    605:        /* NOTREACHED */
                    606: }
                    607: 
                    608: private void
                    609: REreset()
                    610: {
                    611:        register int    i;
                    612: 
                    613:        for (i = 0; i < NPAR; i++)
                    614:                pstrtlst[i] = pendlst[i] = 0;
                    615: }
                    616: 
                    617: /* Index LINE at OFFSET.  If lbuf_okay is nonzero it's okay to use linebuf
                    618:    if LINE is the current line.  This should save lots of time in things
                    619:    like paren matching in LISP mode.  Saves all that copying from linebuf
                    620:    to a local buffer.  substitute() is the guy who calls re_lindex with
                    621:    lbuf_okay as 0, since the substitution gets placed in linebuf ...
                    622:    doesn't work too well when the source and destination strings are the
                    623:    same.  I hate all these arguments!
                    624: 
                    625:    This code is cumbersome, repetetive for reasons of efficiency.  Fast
                    626:    search is a must as far as I am concerned. */
                    627: 
                    628: int
                    629: re_lindex(line, offset, re_blk, lbuf_okay, crater)
                    630: Line   *line;
                    631: int    offset;
                    632: struct RE_block        *re_blk;
                    633: int    lbuf_okay;
                    634: int    crater; /* offset of previous substitute (or -1) */
                    635: {
                    636:        register char   *p;
                    637:        register int    firstc = re_blk->r_firstc;
                    638:        register int    anchored = re_blk->r_anchored;
                    639:        int             re_dir = REdirection;
                    640:        char            **alts = re_blk->r_alternates;
                    641: 
                    642:        REreset();
                    643:        if (lbuf_okay) {
                    644:                REbolp = lbptr(line);
                    645:                if (offset == -1)
                    646:                        offset = strlen(REbolp);        /* arg! */
                    647:        } else {
                    648:                REbolp = ltobuf(line, re_blk->r_lbuf);
                    649:                if (offset == -1) {     /* Reverse search, find end of line. */
                    650:                        offset = Jr_Len;        /* Just Read Len. */
                    651:                }
                    652:        }
                    653: 
                    654:        if (anchored == YES) {
                    655:                if (re_dir == FORWARD) {
                    656:                        if (offset != 0 || crater != -1)
                    657:                                return NO;
                    658:                } else
                    659:                        offset = 0;
                    660:        }
                    661: 
                    662:        p = REbolp + offset;
                    663:        locrater = REbolp + crater;
                    664: 
                    665:        if (firstc != '\0') {
                    666:                char    *first_alt = *alts;
                    667: 
                    668:                if (re_dir == FORWARD) {
                    669:                        while (CaseEquiv[*p] != firstc || !REmatch(p, first_alt))
                    670:                                if (*p++ == '\0')
                    671:                                        return NO;
                    672:                } else {
                    673:                        while (CaseEquiv[*p] != firstc || !REmatch(p, first_alt))
                    674:                                if (--p < REbolp)
                    675:                                        return NO;
                    676:                }
                    677:        } else {
                    678:                for (;;) {
                    679:                        register char   **altp = alts;
                    680: 
                    681:                        while (*altp != NULL)
                    682:                                if (REmatch(p, *altp++))
                    683:                                        goto success;
                    684:                        if (anchored ||
                    685:                            (re_dir == FORWARD ? *p++ == '\0' : --p < REbolp))
                    686:                                return NO;
                    687:                }
                    688: success:;
                    689:        }
                    690:        loc1 = p;
                    691:        REbom = loc1 - REbolp;
                    692: 
                    693:        return YES;
                    694: }
                    695: 
                    696: int    okay_wrap = 0;  /* Do a wrap search ... not when we're
                    697:                           parsing errors ... */
                    698: 
                    699: Bufpos *
                    700: dosearch(pattern, dir, re)
                    701: char   *pattern;
                    702: int dir,
                    703:     re;
                    704: {
                    705:        Bufpos  *pos;
                    706:        struct RE_block re_blk;         /* global re-compiled buffer */
                    707: 
                    708:        if (bobp() && eobp())   /* Can't match!  There's no buffer. */
                    709:                return 0;
                    710: 
                    711:        REcompile(pattern, re, &re_blk);
                    712: 
                    713:        pos = docompiled(dir, &re_blk);
                    714:        return pos;
                    715: }
                    716: 
                    717: Bufpos *
                    718: docompiled(dir, re_blk)
                    719: int dir;
                    720: register struct RE_block       *re_blk;
                    721: {
                    722:        static Bufpos   ret;
                    723:        register Line   *lp;
                    724:        register int    offset;
                    725:        int     we_wrapped = NO;
                    726: 
                    727:        lsave();
                    728:        /* Search now lsave()'s so it doesn't make any assumptions on
                    729:           whether the the contents of curline/curchar are in linebuf.
                    730:           Nowhere does search write all over linebuf.  However, we have to
                    731:           be careful about what calls we make here, because many of them
                    732:           assume (and rightly so) that curline is in linebuf. */
                    733: 
                    734:        REdirection = dir;
                    735:        lp = curline;
                    736:        offset = curchar;
                    737:        if (dir == BACKWARD) {
                    738:                if (bobp()) {
                    739:                        if (okay_wrap && WrapScan)
                    740:                                goto doit;
                    741:                        return 0;
                    742:                }
                    743:                /* here we simulate BackChar() */
                    744:                if (bolp()) {
                    745:                        lp = lp->l_prev;
                    746:                        offset = length(lp);
                    747:                } else
                    748:                        offset -= 1;
                    749:        } else if ((dir == FORWARD) &&
                    750:                   (lbptr(lp)[offset] == '\0') &&
                    751:                   !lastp(lp)) {
                    752:                lp = lp->l_next;
                    753:                offset = 0;
                    754:        }
                    755: 
                    756:        do {
                    757:                if (re_lindex(lp, offset, re_blk, YES, -1))
                    758:                        break;
                    759: doit:          lp = (dir == FORWARD) ? lp->l_next : lp->l_prev;
                    760:                if (lp == 0) {
                    761:                        if (okay_wrap && WrapScan) {
                    762:                                lp = (dir == FORWARD) ?
                    763:                                     curbuf->b_first : curbuf->b_last;
                    764:                                we_wrapped = YES;
                    765:                        } else
                    766:                                 break;
                    767:                }
                    768:                if (dir == FORWARD)
                    769:                        offset = 0;
                    770:                else
                    771:                        offset = -1;    /* signals re_lindex ... */
                    772:        } while (lp != curline);
                    773: 
                    774:        if (lp == curline && we_wrapped)
                    775:                lp = 0;
                    776:        if (lp == 0)
                    777:                return 0;
                    778:        ret.p_line = lp;
                    779:        ret.p_char = (dir == FORWARD) ? REeom : REbom;
                    780:        return &ret;
                    781: }
                    782: 
                    783: private char *
                    784: insert(off, endp, which)
                    785: char   *off,
                    786:        *endp;
                    787: int which;
                    788: {
                    789:        register char   *pp;
                    790:        register int    n;
                    791: 
                    792:        n = pendlst[which] - pstrtlst[which];
                    793:        pp = pstrtlst[which];
                    794:        while (--n >= 0) {
                    795:                *off++ = *pp++;
                    796:                if (off >= endp)
                    797:                        len_error(ERROR);
                    798:        }
                    799:        return off;
                    800: }
                    801: 
                    802: /* Perform the substitution.  If DELP is nonzero the matched string is
                    803:    deleted, i.e., the substitution string is not inserted. */
                    804: 
                    805: void
                    806: re_dosub(re_blk, tobuf, delp)
                    807: struct RE_block        *re_blk;
                    808: char   *tobuf;
                    809: int delp;
                    810: {
                    811:        register char   *tp,
                    812:                        *rp;
                    813:        char    *endp;
                    814: 
                    815:        tp = tobuf;
                    816:        endp = tp + LBSIZE;
                    817:        rp = re_blk->r_lbuf;
                    818: 
                    819:        while (rp < loc1)
                    820:                *tp++ = *rp++;
                    821: 
                    822:        if (!delp) {
                    823:                register int    c;
                    824: 
                    825:                rp = rep_str;
                    826:                while ((c = *rp++) != '\0') {
                    827:                        if (c == '\\') {
                    828:                                c = *rp++;
                    829:                                if (c >= '0' && c < re_blk->r_nparens + '0') {
                    830:                                        tp = insert(tp, endp, c - '0');
                    831:                                        continue;
                    832:                                }
                    833:                                if (c == '\0') {
                    834:                                        *tp++ = '\\';
                    835:                                        rp--;   /* be sure to hit again */
                    836:                                }
                    837:                        }
                    838:                        *tp++ = c;
                    839:                        if (tp >= endp)
                    840:                                len_error(ERROR);
                    841:                }
                    842:        }
                    843:        rp = loc2;
                    844:        REdelta = -REeom;
                    845:        REeom = tp - tobuf;
                    846:        REdelta += REeom;
                    847:        if (loc1==rp && *rp!='\0') {
                    848:                /* Skip an extra character if the matched text was a null
                    849:                 * string, but don't skip over the end of line.  This is to
                    850:                 * prevent an infinite number of replacements in the same
                    851:                 * position, e.g., replace "^" with "".
                    852:                 */
                    853:                REeom += 1;
                    854:        }
                    855:        loc2 = re_blk->r_lbuf + REeom;
                    856:        while ((*tp++ = *rp++) != '\0')
                    857:                if (tp >= endp)
                    858:                        len_error(ERROR);
                    859: }
                    860: 
                    861: void
                    862: putmatch(which, buf, size)
                    863: int which;
                    864: char   *buf;
                    865: size_t size;
                    866: {
                    867:        *(insert(buf, buf + size, which)) = '\0';
                    868: }
                    869: 
                    870: void
                    871: setsearch(str)
                    872: char   *str;
                    873: {
                    874:        strcpy(searchstr, str);
                    875: }
                    876: 
                    877: char *
                    878: getsearch()
                    879: {
                    880:        return searchstr;
                    881: }
                    882: 
                    883: void
                    884: RErecur()
                    885: {
                    886:        char    repbuf[sizeof rep_str];
                    887:        Mark    *m = MakeMark(curline, REbom, M_FLOATER);
                    888: 
                    889:        message("Type C-X C-C to continue with query replace.");
                    890: 
                    891:        byte_copy(rep_str, repbuf, sizeof rep_str);
                    892:        Recur();
                    893:        byte_copy(repbuf, rep_str, sizeof rep_str);
                    894:        if (!is_an_arg())
                    895:                ToMark(m);
                    896:        DelMark(m);
                    897: }
                    898: 
                    899: void
                    900: ForSearch()
                    901: {
                    902:        search(FORWARD, UseRE, YES);
                    903: }
                    904: 
                    905: void
                    906: RevSearch()
                    907: {
                    908:        search(BACKWARD, UseRE, YES);
                    909: }
                    910: 
                    911: void
                    912: FSrchND()
                    913: {
                    914:        search(FORWARD, UseRE, NO);
                    915: }
                    916: 
                    917: void
                    918: RSrchND()
                    919: {
                    920:        search(BACKWARD, UseRE, NO);
                    921: }
                    922: 
                    923: private void
                    924: search(dir, re, setdefault)
                    925: int dir,
                    926:     re,
                    927:     setdefault;
                    928: {
                    929:        Bufpos  *newdot;
                    930:        char    *s;
                    931: 
                    932:        s = ask(searchstr, ProcFmt);
                    933:        if (setdefault)
                    934:                setsearch(s);
                    935:        okay_wrap = YES;
                    936:        newdot = dosearch(s, dir, re);
                    937:        okay_wrap = NO;
                    938:        if (newdot == 0) {
                    939:                if (WrapScan)
                    940:                        complain("No \"%s\" in buffer.", s);
                    941:                else
                    942:                        complain("No \"%s\" found to %s.", s,
                    943:                                 (dir == FORWARD) ? "bottom" : "top");
                    944:        }
                    945:        PushPntp(newdot->p_line);
                    946:        SetDot(newdot);
                    947: }
                    948: 
                    949: /* Do we match PATTERN at OFFSET in BUF? */
                    950: 
                    951: int
                    952: LookingAt(pattern, buf, offset)
                    953: char   *pattern,
                    954:        *buf;
                    955: int offset;
                    956: {
                    957:        struct RE_block re_blk;
                    958:        char    **alt = re_blk.r_alternates;
                    959: 
                    960:        REcompile(pattern, YES, &re_blk);
                    961:        REreset();
                    962:        locrater = NULL;
                    963:        REbolp = buf;
                    964: 
                    965:        while (*alt)
                    966:                if (REmatch(buf + offset, *alt++))
                    967:                        return YES;
                    968:        return NO;
                    969: }
                    970: 
                    971: int
                    972: look_at(expr)
                    973: char   *expr;
                    974: {
                    975:        struct RE_block re_blk;
                    976: 
                    977:        REcompile(expr, 0, &re_blk);
                    978:        REreset();
                    979:        locrater = NULL;
                    980:        REbolp = linebuf;
                    981:        if (REmatch(linebuf + curchar, re_blk.r_alternates[0]))
                    982:                return YES;
                    983:        return NO;
                    984: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.