Annotation of researchv10no/sys/vm/vmpage.c, revision 1.1.1.1

1.1       root        1: #include "sys/param.h"
                      2: #include "sys/systm.h"
                      3: #include "sys/inode.h"
                      4: #include "sys/user.h"
                      5: #include "sys/proc.h"
                      6: #include "sys/pte.h"
                      7: #include "sys/buf.h"
                      8: #include "sys/text.h"
                      9: #include "sys/mtpr.h"
                     10: #include "sys/cmap.h"
                     11: #include "sys/vm.h"
                     12: 
                     13: struct pte *Pushmap;
                     14: struct user *pushutl;
                     15: 
                     16: int    nohash = 0;
                     17: /*
                     18:  * Handle a page fault.
                     19:  *
                     20:  * Basic outline
                     21:  *     If page is allocated, but just not valid:
                     22:  *             Wait if intransit, else just revalidate
                     23:  *             Done
                     24:  *     Compute <dev,bn> from which page operation would take place
                     25:  *     If page is text page, and filling from file system or swap space:
                     26:  *             If in free list cache, reattach it and then done
                     27:  *     Allocate memory for page in
                     28:  *             If block here, restart because we could have swapped, etc.
                     29:  *     Lock process from swapping for duration
                     30:  *     Update pte's to reflect that page is intransit.
                     31:  *     If page is zero fill on demand:
                     32:  *             Clear pages and flush free list cache of stale cacheing
                     33:  *             for this swap page (e.g. before initializing again due
                     34:  *             to 407/410 exec).
                     35:  *     If page is fill from file and in buffer cache:
                     36:  *             Copy the page from the buffer cache.
                     37:  *     If not a fill on demand:
                     38:  *             Determine swap address and cluster to page in
                     39:  *     Do the swap to bring the page in
                     40:  *     Instrument the pagein
                     41:  *     After swap validate the required new page
                     42:  *     Leave prepaged pages reclaimable (not valid)
                     43:  *     Update shared copies of text page tables
                     44:  *     Complete bookkeeping on pages brought in:
                     45:  *             No longer intransit
                     46:  *             Hash text pages into core hash structure
                     47:  *             Unlock pages (modulo raw i/o requirements)
                     48:  *             Flush translation buffer
                     49:  *     Process pagein is done
                     50:  */
                     51: int    preptofree = 1;         /* send pre-paged pages to free list */
                     52: static struct cmap dbcmap;     /* debug */
                     53: 
                     54: pagein(virtaddr,uu)
                     55:        caddr_t virtaddr;
                     56:        register struct user *uu;
                     57: {
                     58:        register struct proc *p;
                     59:        register struct pte *pte;
                     60:        register unsigned v;
                     61:        unsigned pf;
                     62:        int type, fileno, prot;
                     63:        struct pte opte;
                     64:        struct buf *bp;
                     65:        dev_t dev;
                     66:        register int i;
                     67:        int klsize;
                     68:        unsigned vsave;
                     69:        struct cmap *c;
                     70:        int j;
                     71:        daddr_t bn, bncache, bnswap;
                     72:        int otime, olbolt, oicr, a, s;
                     73: 
                     74:        s = spl6();
                     75:        otime = time, olbolt = lbolt, oicr = mfpr(ICR);
                     76:        cnt.v_faults++;
                     77:        /*
                     78:         * Classify faulted page into a segment and get a pte
                     79:         * for the faulted page.
                     80:         */
                     81:        vsave = v = clbase(btop((unsigned int)virtaddr));
                     82:        p = uu->u_procp;
                     83:        if (isatsv(p, v))
                     84:                type = CTEXT;
                     85:        else if (isassv(p, v))
                     86:                type = CSTACK;
                     87:        else
                     88:                type = CDATA;
                     89:        pte = vtopte(p, v);
                     90:        if (pte->pg_v)
                     91:                panic("pagein");
                     92: 
                     93:        /*
                     94:         * If page is reclaimable, reclaim it.
                     95:         * If page is text and intransit, sleep while it is intransit,
                     96:         * If it is valid after the sleep, we are done.
                     97:         * Otherwise we have to start checking again, since page could
                     98:         * even be reclaimable now (we may have swapped for a long time).
                     99:         */
                    100: restart:
                    101:        if (pte->pg_fod == 0 && pte->pg_pfnum) {
                    102:                if (type == CTEXT && cmap[pgtocm(pte->pg_pfnum)].c_intrans) {
                    103:                        sleep((caddr_t)p->p_textp, PSWP+1);
                    104:                        pte = vtopte(p, v);
                    105:                        if (pte->pg_v) {
                    106: valid:
                    107:                                if (p->p_flag & SDLYU) {
                    108:                                        mlock(pte->pg_pfnum);
                    109:                                        if (!pte->pg_v) {
                    110:                                                munlock(pte->pg_pfnum);
                    111:                                                goto restart;
                    112:                                        }
                    113:                                }
                    114:                                tbiscl(v);
                    115:                                cnt.v_intrans++;
                    116:                                return;
                    117:                        }
                    118:                        goto restart;
                    119:                }
                    120:                /*
                    121:                 * If page is in the free list, then take
                    122:                 * it back into the resident set, updating
                    123:                 * the size recorded for the resident set.
                    124:                 */
                    125:                if (cmap[pgtocm(pte->pg_pfnum)].c_free) {
                    126:                        munlink(pte->pg_pfnum);
                    127:                        cnt.v_pgfrec++;
                    128:                        if (type == CTEXT)
                    129:                                p->p_textp->x_rssize += CLSIZE;
                    130:                        else
                    131:                                p->p_rssize += CLSIZE;
                    132:                }
                    133:                pte->pg_v = 1;
                    134:                if (anycl(pte, pg_m))
                    135:                        pte->pg_m = 1;
                    136:                distcl(pte);
                    137:                if (type == CTEXT)
                    138:                        distpte(p->p_textp, vtotp(p, v), pte);
                    139:                if (p->p_flag & SDLYU) {
                    140:                        mlock(pte->pg_pfnum);
                    141:                        if (!pte->pg_v) {
                    142:                                munlock(pte->pg_pfnum);
                    143:                                goto restart;
                    144:                        }
                    145:                }
                    146:                uu->u_vm.vm_minflt++;
                    147:                cnt.v_pgrec++;
                    148:                tbiscl(v);
                    149:                a = vmtime(otime, olbolt, oicr);
                    150:                rectime += a;
                    151:                if (a >= 0)
                    152:                        vmfltmon(rmon, a, rmonmin, rres, NRMON);
                    153:                splx(s);
                    154:                return;
                    155:        }
                    156:        splx(s);
                    157:        /*
                    158:         * <dev,bn> is where data comes from/goes to.
                    159:         * <dev,bncache> is where data is cached from/to.
                    160:         * <swapdev,bnswap> is where data will eventually go.
                    161:         */
                    162:        if (pte->pg_fod == 0) {
                    163:                fileno = -1;
                    164:                bnswap = bncache = bn = dbtofsb(swapdev,
                    165:                        vtod(p, v, &uu->u_dmap, &uu->u_smap));
                    166:                dev = swapdev;
                    167:        } else {
                    168:                fileno = ((struct fpte *)pte)->pg_source;
                    169:                bn = ((struct fpte *)pte)->pg_blkno;
                    170:                bnswap = dbtofsb(swapdev, vtod(p, v, &uu->u_dmap, &uu->u_smap));
                    171:                if (fileno == PG_FTEXT) {
                    172:                        if (p->p_textp == 0)
                    173:                                panic("pagein PG_FTEXT");
                    174:                        dev = p->p_textp->x_iptr->i_dev;
                    175:                        bncache = bn;
                    176:                } else { /* PG_FZERO */
                    177:                        dev = swapdev;
                    178:                        bncache = bnswap;
                    179:                }
                    180:        }
                    181:        klsize = 1;
                    182:        opte = *pte;
                    183: 
                    184:        /*
                    185:         * Check for text detached but in free list.
                    186:         * This can happen only if the page is filling
                    187:         * from a inode or from the swap device, (e.g. not when reading
                    188:         * in 407/410 execs to a zero fill page.)
                    189:         * honour lock bit to avoid race with pageout
                    190:         */
                    191:        if (type == CTEXT && fileno != PG_FZERO && !nohash) {
                    192:                while ((c = mfind(getfsx(dev), bncache)) != 0) {
                    193:                        pf = cmtopg(c - cmap);
                    194:                        if (c->c_lock == 0)
                    195:                                break;
                    196:                        mlock(pf);
                    197:                        munlock(pf);
                    198:                }
                    199:                if (c) {
                    200:                        dbcmap = *c;
                    201:                        if (c->c_type != CTEXT || c->c_gone == 0 ||
                    202:                            c->c_free == 0)
                    203:                                panic("pagein mfind");
                    204:                        p->p_textp->x_rssize += CLSIZE;
                    205:                        /*
                    206:                         * Following code mimics memall().
                    207:                         */
                    208:                        pf = cmtopg(c - cmap);
                    209:                        munlink(pf);
                    210:                        for (j = 0; j < CLSIZE; j++) {
                    211:                                *(int *)pte = pf++;
                    212:                                pte->pg_prot = opte.pg_prot;
                    213:                                pte++;
                    214:                        }
                    215:                        pte -= CLSIZE;
                    216:                        c->c_free = 0;
                    217:                        c->c_gone = 0;
                    218:                        if (c->c_intrans || c->c_want)
                    219:                                panic("pagein intrans|want");
                    220:                        c->c_lock = 1;
                    221:                        if (c->c_page != vtotp(p, v))
                    222:                                panic("pagein c_page chgd");
                    223:                        c->c_ndx = p->p_textp - &text[0];
                    224:                        if (dev == swapdev)
                    225:                                cnt.v_xsfrec++;
                    226:                        else
                    227:                                cnt.v_xifrec++;
                    228:                        cnt.v_pgrec++;
                    229:                        uu->u_vm.vm_minflt++;
                    230:                        if (dev != swapdev) {
                    231:                                c = mfind(MSWAPX, bnswap);
                    232:                                if (c)
                    233:                                        munhash(MSWAPX, bnswap);
                    234:                                pte->pg_swapm = 1;
                    235:                        }
                    236:                        goto skipswap;
                    237:                }
                    238:        }
                    239: 
                    240:        /*
                    241:         * Wasn't reclaimable or reattachable.
                    242:         * Have to prepare to bring the page in.
                    243:         * We allocate the page before locking so we will
                    244:         * be swappable if there is no free memory.
                    245:         * If we block we have to start over, since anything
                    246:         * could have happened.
                    247:         */
                    248:        if (freemem < CLSIZE * KLMAX) {
                    249:                while (freemem < CLSIZE * KLMAX)
                    250:                        sleep((caddr_t)&freemem, PSWP+2);
                    251:                pte = vtopte(p, v);
                    252:                if (pte->pg_v)
                    253:                        goto valid;
                    254:                goto restart;
                    255:        }
                    256: 
                    257:        /*
                    258:         * Now can get memory and committed to bringing in the page.
                    259:         * Lock this process, get a page,
                    260:         * construct the new pte, and increment
                    261:         * the (process or text) resident set size.
                    262:         */
                    263:        p->p_flag |= SPAGE;
                    264:        (void) memall(pte, CLSIZE, p, type);
                    265:        pte->pg_prot = opte.pg_prot;
                    266:        pf = pte->pg_pfnum;
                    267:        cmap[pgtocm(pf)].c_intrans = 1;
                    268:        distcl(pte);
                    269:        if (type == CTEXT) {
                    270:                p->p_textp->x_rssize += CLSIZE;
                    271:                distpte(p->p_textp, vtotp(p, v), pte);
                    272:        } else
                    273:                p->p_rssize += CLSIZE;
                    274: 
                    275:        /*
                    276:         * Two cases: either fill on demand (zero or text)
                    277:         * or from swap space.
                    278:         */
                    279:        if (opte.pg_fod) {
                    280:                pte->pg_swapm = 1;
                    281:                if (fileno == PG_FZERO || fileno == PG_FTEXT) {
                    282:                        /*
                    283:                         * Flush any previous text page use of this
                    284:                         * swap device block.
                    285:                         */
                    286:                        if (type == CTEXT) {
                    287:                                c = mfind(MSWAPX, bnswap);
                    288:                                if (c)
                    289:                                        munhash(MSWAPX, bnswap);
                    290:                        }
                    291:                        /*
                    292:                         * If zero fill, short-circuit hard work
                    293:                         * by just clearing pages.
                    294:                         */
                    295:                        if (fileno == PG_FZERO) {
                    296:                                for (i = 0; i < CLSIZE; i++)
                    297:                                        clearseg(pf+i);
                    298:                                if (type != CTEXT)
                    299:                                        cnt.v_zfod += CLSIZE;
                    300:                                goto skipswap;
                    301:                        }
                    302:                        cnt.v_exfod += CLSIZE;
                    303:                } else
                    304:                        /*
                    305:                         * Vreading block... whoops
                    306:                         */
                    307:                        panic("pagein, vrpages ref'd");
                    308:                /*
                    309:                 * Check that block is not in file system buffer cache.
                    310:                 * The way the cache is handled now, this
                    311:                 * happens only once every 2 days.
                    312:                 */
                    313:                if (bp = baddr(dev, bn)) {
                    314:                        pte->pg_v = 1;
                    315:                        prot = *(int *)pte & PG_PROT;
                    316:                        pte->pg_prot = 0;
                    317:                        *(int *)pte |= PG_UW;
                    318:                        distcl(pte);
                    319:                        tbiscl(v);
                    320:                        /* THIS ASSUMES THAT CLSIZE*NBPG==BSIZE */
                    321:                        bcopy(bp->b_un.b_addr, ptob(v), BSIZE(dev));
                    322:                        brelse(bp);
                    323:                        pte->pg_prot = 0;
                    324:                        *(int *)pte |= prot;
                    325:                        goto skipswap;
                    326:                }
                    327:        } else {
                    328:                if (opte.pg_pfnum)
                    329:                        panic("pagein pfnum");
                    330:                /*
                    331:                 * Fill from swap area.  Try to find adjacent
                    332:                 * pages to bring in also.
                    333:                 */
                    334:                v = kluster(p, v, pte, B_READ, &klsize,
                    335:                    (type == CTEXT) ? kltxt :
                    336:                    ((p->p_flag & SSEQL) ? klseql : klin), bn);
                    337:                /* THIS COULD BE COMPUTED INCREMENTALLY... */
                    338:                bncache = bn = dbtofsb(swapdev, vtod(p, v, &uu->u_dmap, &uu->u_smap));
                    339:        }
                    340: 
                    341:        distcl(pte);
                    342:        swap(p, fsbtodb(dev, bn), ptob(v), klsize * ctob(CLSIZE),
                    343:            B_READ, B_PGIN, dev, 0); 
                    344: 
                    345:        /*
                    346:         * Instrumentation.
                    347:         */
                    348:        uu->u_vm.vm_majflt++;
                    349:        cnt.v_pgin++;
                    350:        cnt.v_pgpgin += klsize * CLSIZE;
                    351:        a = vmtime(otime, olbolt, oicr) / 100;
                    352:        pgintime += a;
                    353:        if (a >= 0)
                    354:                vmfltmon(pmon, a, pmonmin, pres, NPMON);
                    355: 
                    356: skipswap:
                    357:        /*
                    358:         * Fix page table entries.
                    359:         *
                    360:         * Only page requested in is validated, and rest of pages
                    361:         * can be ``reclaimed''.  This allows system to reclaim prepaged pages
                    362:         * quickly if they are not used and memory is tight.
                    363:         */
                    364:        pte = vtopte(p, vsave);
                    365:        pte->pg_v = 1;
                    366:        distcl(pte);
                    367:        if (type == CTEXT) {
                    368:                distpte(p->p_textp, vtotp(p, vsave), pte);
                    369:                if (opte.pg_fod)
                    370:                        p->p_textp->x_flag |= XWRIT;
                    371:                wakeup((caddr_t)p->p_textp);
                    372:        }
                    373: 
                    374:        /*
                    375:         * Memall returned page(s) locked.  Unlock all
                    376:         * pages in cluster.  If locking pages for raw i/o
                    377:         * leave the page which was required to be paged in locked,
                    378:         * but still unlock others.
                    379:         * If text pages, hash into the cmap situation table.
                    380:         */
                    381:        pte = vtopte(p, v);
                    382:        for (i = 0; i < klsize; i++) {
                    383:                c = &cmap[pgtocm(pte->pg_pfnum)];
                    384:                c->c_intrans = 0;
                    385:                if (type == CTEXT && c->c_blkno == 0 && bncache && !nohash) {
                    386:                        mhash(c, getfsx(dev), bncache);
                    387:                        bncache++;
                    388:                }
                    389:                if (v != vsave || (p->p_flag & SDLYU) == 0)
                    390:                        munlock(pte->pg_pfnum);
                    391:                if (v != vsave && type != CTEXT && preptofree) {
                    392:                        /*
                    393:                         * Throw pre-paged data/stack pages at the
                    394:                         * bottom of the free list.
                    395:                         */
                    396:                        p->p_rssize -= CLSIZE;
                    397:                        memfree(pte, CLSIZE, 0);
                    398:                }
                    399:                tbiscl(v);                      /* conservative ? */
                    400:                v += CLSIZE;
                    401:                pte += CLSIZE;
                    402:        }
                    403: 
                    404:        /*
                    405:         * All done.
                    406:         */
                    407:        p->p_flag &= ~SPAGE;
                    408:        if (p->p_flag & SPROCWT) {
                    409:                register s = spl6();
                    410:                p->p_flag &= ~SPROCWT;
                    411:                p->p_usrpri = 127;
                    412:                wakeup((caddr_t)&(p->p_stat));
                    413:                ++runrun;
                    414:                splx(s);
                    415:        }
                    416: 
                    417:        /*
                    418:         * If process is declared fifo, memory is tight,
                    419:         * and this was a data page-in, free memory
                    420:         * klsdist pagein clusters away from the current fault.
                    421:         */
                    422:        if ((p->p_flag&SSEQL) && freemem < lotsfree &&
                    423:            type == CDATA && p == u.u_procp) {
                    424:                int k = (vtodp(p, vsave) / CLSIZE) / klseql;
                    425: #ifdef notdef
                    426:                if (vsave > uu->u_vsave)
                    427:                        k -= klsdist;
                    428:                else
                    429:                        k += klsdist;
                    430:                dpageout(p, k * klseql * CLSIZE, klout*CLSIZE);
                    431:                uu->u_vsave = vsave;
                    432: #else
                    433:                dpageout(p, (k - klsdist) * klseql * CLSIZE, klout*CLSIZE);
                    434:                dpageout(p, (k + klsdist) * klseql * CLSIZE, klout*CLSIZE);
                    435: #endif
                    436:        }
                    437: }
                    438: 
                    439: #if defined(BERT)
                    440: int    dmod = 1000000;
                    441: int    dcnt;
                    442: #endif
                    443: /*
                    444:  * Take away n pages of data space
                    445:  * starting at data page dp.
                    446:  * Used to take pages away from sequential processes.
                    447:  * Mimics pieces of code in pageout() below.
                    448:  */
                    449: dpageout(p, dp, n)
                    450:        struct proc *p;
                    451:        int dp, n;
                    452: {
                    453:        register struct cmap *c;
                    454:        int i, klsize;
                    455:        register struct pte *pte;
                    456:        unsigned v;
                    457:        daddr_t daddr;
                    458: 
                    459:        if (dp < 0) {
                    460:                n += dp;
                    461:                dp = 0;
                    462:        }
                    463:        if (dp + n > p->p_dsize)
                    464:                n = p->p_dsize - dp;
                    465: #if defined(BERT)
                    466:        if (++dcnt % dmod == 0)
                    467:                printf("dp %d, n %d\n", dp, n);
                    468: #endif
                    469:        for (i = 0; i < n; i += CLSIZE, dp += CLSIZE) {
                    470:                pte = dptopte(p, dp);
                    471:                if (pte->pg_fod || pte->pg_pfnum == 0)
                    472:                        continue;
                    473:                c = &cmap[pgtocm(pte->pg_pfnum)];
                    474:                if (c->c_lock || c->c_free)
                    475:                        continue;
                    476:                if (pte->pg_v) {
                    477:                        pte->pg_v = 0;
                    478:                        if (anycl(pte, pg_m))
                    479:                                pte->pg_m = 1;
                    480:                        distcl(pte);
                    481:                }
                    482:                if (dirtycl(pte)) {
                    483:                        if (bswlist.av_forw == NULL)
                    484:                                continue;
                    485:                        mlock(pte->pg_pfnum);
                    486:                        if (anycl(pte, pg_m)) {
                    487:                                pte->pg_m = 0;
                    488:                        }
                    489:                        pte->pg_swapm = 0;
                    490:                        distcl(pte);
                    491:                        p->p_poip++;
                    492:                        v = kluster(p, dptov(p, dp), pte, B_WRITE,
                    493:                                &klsize, klout, (daddr_t)0);
                    494:                        /* THIS ASSUMES THAT p == u.u_procp */
                    495:                        daddr = vtod(p, v, &u.u_dmap, &u.u_smap);
                    496:                        swap(p, daddr, ptob(v), klsize * ctob(CLSIZE),
                    497:                            B_WRITE, B_DIRTY, swapdev, pte->pg_pfnum);
                    498:                } else {
                    499:                        if (c->c_gone == 0)
                    500:                                p->p_rssize -= CLSIZE;
                    501:                        memfree(pte, CLSIZE, 0);
                    502:                        cnt.v_seqfree += CLSIZE;
                    503:                }
                    504:        }
                    505: }
                    506:                    
                    507: int    fifo = 0;
                    508: /*
                    509:  * The page out daemon, which runs as process 2.
                    510:  *
                    511:  * As long as there are at least lotsfree pages,
                    512:  * this process is not run.  When the number of free
                    513:  * pages stays in the range desfree to lotsfree,
                    514:  * this daemon runs through the pages in the loop
                    515:  * at a rate determined in vmsched(), simulating the missing
                    516:  * hardware reference bit, and cleaning pages and transferring
                    517:  * them to the free list.
                    518:  */
                    519: int hand;
                    520: pageout()
                    521: {
                    522:        register struct proc *rp;
                    523:        register struct text *xp;
                    524:        register struct cmap *c;
                    525:        register struct pte *pte;
                    526:        int count, pushes;
                    527:        swblk_t daddr;
                    528:        unsigned v;
                    529:        int maxhand = pgtocm(maxfree);
                    530:        int klsize;
                    531: 
                    532: loop:
                    533:        /*
                    534:         * Before sleeping, look to see if there are any swap I/O headers
                    535:         * in the ``cleaned'' list that correspond to dirty
                    536:         * pages that have been pushed asynchronously. If so,
                    537:         * empty the list by calling cleanup().
                    538:         *
                    539:         * N.B.: We guarantee never to block while the cleaned list is nonempty.
                    540:         */
                    541:        (void) spl6();
                    542:        if (bclnlist != NULL)
                    543:                cleanup();
                    544:        sleep((caddr_t)&proc[PAGEPID], PSWP+1);
                    545:        (void) spl0();
                    546:        count = 0;
                    547:        pushes = 0;
                    548:        while (nscan < desscan && freemem < lotsfree) {
                    549: top:
                    550:                /*
                    551:                 * An iteration of the clock pointer (hand) around the loop.
                    552:                 * Look at the page at hand.  If it is a
                    553:                 * locked (for physical i/o e.g.), system (u., page table)
                    554:                 * or free, then leave it alone.
                    555:                 * Otherwise, find a process and text pointer for the
                    556:                 * page, and a virtual page number in either the
                    557:                 * process or the text image.
                    558:                 */
                    559:                c = &cmap[hand];
                    560:                if (c->c_lock || c->c_free)
                    561:                        goto skip;
                    562:                switch (c->c_type) {
                    563: 
                    564:                case CSYS:
                    565:                        goto skip;
                    566: 
                    567:                case CTEXT:
                    568:                        xp = &text[c->c_ndx];
                    569:                        rp = xp->x_caddr;
                    570:                        v = tptov(rp, c->c_page);
                    571:                        pte = tptopte(rp, c->c_page);
                    572:                        break;
                    573: 
                    574:                case CDATA:
                    575:                case CSTACK:
                    576:                        rp = &proc[c->c_ndx];
                    577:                        /* xp = rp->p_textp; */
                    578:                        if (c->c_type == CDATA) {
                    579:                                v = dptov(rp, c->c_page);
                    580:                                pte = dptopte(rp, c->c_page);
                    581:                        } else {
                    582:                                v = sptov(rp, c->c_page);
                    583:                                pte = sptopte(rp, c->c_page);
                    584:                        }
                    585:                        break;
                    586:                }
                    587:                if (pte->pg_pfnum != cmtopg(hand))
                    588:                        panic("bad c_page");
                    589:                /*
                    590:                 * If page is valid; make invalid but reclaimable.
                    591:                 * If this pte is not valid, then it must be reclaimable
                    592:                 * and we can add it to the free list.
                    593:                 */
                    594:                if (pte->pg_v) {
                    595:                        pte->pg_v = 0;
                    596:                        if (anycl(pte, pg_m))
                    597:                                pte->pg_m = 1;
                    598:                        distcl(pte);
                    599:                        if (c->c_type == CTEXT)
                    600:                                distpte(xp, vtotp(rp, v), pte);
                    601:                        if ((rp->p_flag & (SSEQL|SUANOM)) || fifo ||
                    602:                            rp->p_rssize > rp->p_maxrss)
                    603:                                goto take;
                    604:                } else {
                    605: take:
                    606:                        if (c->c_type != CTEXT) {
                    607:                                /*
                    608:                                 * Guarantee a minimal investment in data
                    609:                                 * space for jobs in balance set.
                    610:                                 */
                    611:                                if (rp->p_rssize < saferss - rp->p_slptime)
                    612:                                        goto skip;
                    613:                        }
                    614: 
                    615:                        /*
                    616:                         * If the page is currently dirty, we
                    617:                         * have to arrange to have it cleaned before it
                    618:                         * can be freed.  We mark it clean immediately.
                    619:                         * If it is reclaimed while being pushed, then modified
                    620:                         * again, we are assured of the correct order of 
                    621:                         * writes because we lock the page during the write.  
                    622:                         * This guarantees that a swap() of this process (and
                    623:                         * thus this page), initiated in parallel, will,
                    624:                         * in fact, push the page after us.
                    625:                         *
                    626:                         * The most general worst case here would be for
                    627:                         * a reclaim, a modify and a swapout to occur
                    628:                         * all before the single page transfer completes.
                    629:                         */
                    630:                        if (dirtycl(pte)) {
                    631:                                /*
                    632:                                 * Limit pushes to avoid saturating
                    633:                                 * pageout device.
                    634:                                 *
                    635:                                 * MAGIC 4 BECAUSE WE RUN EVERY 1/4 SEC (clock)
                    636:                                 */
                    637:                                if (pushes > maxpgio / 4)
                    638:                                        goto skip;
                    639:                                pushes++;
                    640:                                /*
                    641:                                 * If the process is being swapped out
                    642:                                 * or about to exit, do not bother with its
                    643:                                 * dirty pages
                    644:                                 */
                    645:                                if (rp->p_flag & (SLOCK|SWEXIT))
                    646:                                        goto skip;
                    647: 
                    648:                                /*
                    649:                                 * Now carefully make sure that there will
                    650:                                 * be a header available for the push so that
                    651:                                 * we will not block waiting for a header in
                    652:                                 * swap().  The reason this is important is
                    653:                                 * that we (proc[PAGEPID]) are the one who cleans
                    654:                                 * dirty swap headers and we could otherwise
                    655:                                 * deadlock waiting for ourselves to clean
                    656:                                 * swap headers.  The sleep here on &proc[PAGEPID]
                    657:                                 * is actually (effectively) a sleep on both
                    658:                                 * ourselves and &bswlist, and this is known
                    659:                                 * to iodone and swap in bio.c.  That is,
                    660:                                 * &proc[PAGEPID] will be awakened both when dirty
                    661:                                 * headers show up and also to get the pageout
                    662:                                 * daemon moving.
                    663:                                 */
                    664:                                (void) spl6();
                    665:                                if (bclnlist != NULL)
                    666:                                        cleanup();
                    667:                                if (bswlist.av_forw == NULL) {
                    668:                                        bswlist.b_flags |= B_WANTED;
                    669:                                        sleep((caddr_t)&proc[PAGEPID], PSWP+2);
                    670:                                        (void) spl0();
                    671:                                        /*
                    672:                                         * Page disposition may have changed
                    673:                                         * since process may have exec'ed,
                    674:                                         * forked, exited or just about
                    675:                                         * anything else... try this page
                    676:                                         * frame again, from the top.
                    677:                                         */
                    678:                                        goto top;
                    679:                                }
                    680:                                (void) spl0();
                    681: 
                    682:                                mlock((unsigned)cmtopg(hand));
                    683:                                uaccess(rp, Pushmap, pushutl);
                    684:                                /*
                    685:                                 * Now committed to pushing the page...
                    686:                                 */
                    687:                                if (anycl(pte, pg_m)) {
                    688:                                        pte->pg_m = 0;
                    689:                                }
                    690:                                pte->pg_swapm = 0;
                    691:                                distcl(pte);
                    692:                                if (c->c_type == CTEXT)  {
                    693:                                        xp->x_poip++;
                    694:                                        distpte(xp, vtotp(rp, v), pte);
                    695:                                } else
                    696:                                        rp->p_poip++;
                    697:                                v = kluster(rp, v, pte, B_WRITE, &klsize, klout, (daddr_t)0);
                    698:                                if (klsize == 0)
                    699:                                        panic("pageout klsize");
                    700:                                daddr = vtod(rp, v, &pushutl->u_dmap, &pushutl->u_smap);
                    701:                                swap(rp, daddr, ptob(v), klsize * ctob(CLSIZE),
                    702:                                    B_WRITE, B_DIRTY, swapdev, pte->pg_pfnum);
                    703:                                /*
                    704:                                 * The cleaning of this page will be
                    705:                                 * completed later, in cleanup() called
                    706:                                 * (synchronously) by us (proc[PAGEPID]).  In
                    707:                                 * the meantime, the page frame is locked
                    708:                                 * so no havoc can result.
                    709:                                 */
                    710:                                goto skip;
                    711: 
                    712:                        }
                    713:                        /*
                    714:                         * Decrement the resident set size of the current
                    715:                         * text object/process, and put the page in the
                    716:                         * free list. Note that we don't give memfree the
                    717:                         * pte as its argument, since we don't want to destroy
                    718:                         * the pte.  If it hasn't already been discarded
                    719:                         * it may yet have a chance to be reclaimed from
                    720:                         * the free list.
                    721:                         */
                    722:                        if (c->c_gone == 0)
                    723:                                if (c->c_type == CTEXT)
                    724:                                        xp->x_rssize -= CLSIZE;
                    725:                                else
                    726:                                        rp->p_rssize -= CLSIZE;
                    727:                        memfree(pte, CLSIZE, 0);
                    728:                        cnt.v_dfree += CLSIZE;
                    729: 
                    730:                        /*
                    731:                         * We managed to add a page to the free list,
                    732:                         * so we give ourselves another couple of trips
                    733:                         * around the loop.
                    734:                         */
                    735:                        count = 0;
                    736:                }
                    737: skip:
                    738:                cnt.v_scan++;
                    739:                nscan++;
                    740:                if (++hand >= maxhand) {
                    741:                        hand = 0;
                    742:                        cnt.v_rev++;
                    743:                        if (count > 2) {
                    744:                                /*
                    745:                                 * Extremely unlikely, but we went around
                    746:                                 * the loop twice and didn't get anywhere.
                    747:                                 * Don't cycle, stop till the next clock tick.
                    748:                                 */
                    749:                                goto loop;
                    750:                        }
                    751:                        count++;
                    752:                }
                    753:        }
                    754:        goto loop;
                    755: }
                    756: 
                    757: /*
                    758:  * Process the ``cleaned'' list.
                    759:  *
                    760:  * Scan through the linked list of swap I/O headers
                    761:  * and free the corresponding pages that have been
                    762:  * cleaned by being written back to the paging area.
                    763:  * If the page has been reclaimed during this time,
                    764:  * we do not free the page.  As they are processed,
                    765:  * the swap I/O headers are removed from the cleaned
                    766:  * list and inserted into the free list.
                    767:  */
                    768: cleanup()
                    769: {
                    770:        register struct buf *bp;
                    771:        register struct proc *rp;
                    772:        register struct text *xp;
                    773:        register struct cmap *c;
                    774:        register struct pte *pte;
                    775:        unsigned pf;
                    776:        register int i;
                    777:        int s;
                    778: 
                    779:        for (;;) {
                    780:                s = spl6();
                    781:                if ((bp = bclnlist) == NULL) {
                    782:                        splx(s);
                    783:                        break;
                    784:                }
                    785:                bclnlist = bp->av_forw;
                    786:                splx(s);
                    787:                pte = dptopte(&proc[PAGEPID], btop(bp->b_un.b_addr));
                    788:                for (i = 0; i < bp->b_bcount; i += CLSIZE * NBPG) {
                    789:                        pf = pte->pg_pfnum;
                    790:                        munlock(pf);
                    791:                        c = &cmap[pgtocm(pf)];
                    792:                        if (c->c_gone) {
                    793:                                memfree(pte, CLSIZE, 0);
                    794:                                cnt.v_dfree += CLSIZE;
                    795:                        }
                    796:                        pte += CLSIZE;
                    797:                }
                    798:                c = &cmap[pgtocm(bp->b_pfcent)];
                    799:                switch (c->c_type) {
                    800: 
                    801:                case CSYS:
                    802:                        panic("cleanup CSYS");
                    803: 
                    804:                case CTEXT:
                    805:                        xp = &text[c->c_ndx];
                    806:                        xp->x_poip--;
                    807:                        if (xp->x_poip == 0)
                    808:                                wakeup((caddr_t)&xp->x_poip);
                    809:                        break;
                    810: 
                    811:                case CDATA:
                    812:                case CSTACK:
                    813:                        rp = &proc[c->c_ndx];
                    814:                        rp->p_poip--;
                    815:                        if (rp->p_poip == 0)
                    816:                                wakeup((caddr_t)&rp->p_poip);
                    817:                        break;
                    818:                }
                    819:                if (c->c_gone == 0) {
                    820:                        switch (c->c_type) {
                    821: 
                    822:                        case CTEXT:
                    823:                                pte = tptopte(xp->x_caddr, c->c_page);
                    824:                                break;
                    825: 
                    826:                        case CDATA:
                    827:                                pte = dptopte(rp, c->c_page);
                    828:                                break;
                    829: 
                    830:                        case CSTACK:
                    831:                                pte = sptopte(rp, c->c_page);
                    832:                                break;
                    833:                        }
                    834:                        if (pte->pg_v == 0) {
                    835:                                if (c->c_type == CTEXT)
                    836:                                        xp->x_rssize -= CLSIZE;
                    837:                                else
                    838:                                        rp->p_rssize -= CLSIZE;
                    839:                                memfree(pte, CLSIZE, 0);
                    840:                                cnt.v_dfree += CLSIZE;
                    841:                        }
                    842:                }
                    843:                bp->b_flags = 0;
                    844:                bp->av_forw = bswlist.av_forw;
                    845:                bswlist.av_forw = bp;
                    846:                if (bswlist.b_flags & B_WANTED) {
                    847:                        bswlist.b_flags &= ~B_WANTED;
                    848:                        wakeup((caddr_t)&bswlist);
                    849:                }
                    850:        }
                    851: }
                    852: 
                    853: /*
                    854:  * Kluster locates pages adjacent to the argument pages
                    855:  * that are immediately available to include in the pagein/pageout,
                    856:  * and given the availability of memory includes them.
                    857:  * It knows that the process image is contiguous in chunks;
                    858:  * an assumption here is that CLSIZE * KLMAX is a divisor of dmmin,
                    859:  * so that by looking at KLMAX chunks of pages, all such will
                    860:  * necessarily be mapped swap contiguous.
                    861:  */
                    862: int    noklust;
                    863: int    klicnt[KLMAX];
                    864: int    klocnt[KLMAX];
                    865: 
                    866: kluster(p, v, pte0, rw, pkl, klsize, bn0)
                    867:        register struct proc *p;
                    868:        unsigned v;
                    869:        struct pte *pte0;
                    870:        int rw, *pkl, klsize;
                    871:        daddr_t bn0;
                    872: {
                    873:        int type, cl, clmax;
                    874:        int kloff, k, klmax;
                    875:        register struct pte *pte;
                    876:        int klback, klforw;
                    877:        register int i;
                    878:        unsigned v0;
                    879:        daddr_t bn;
                    880: 
                    881:        if (rw == B_READ)
                    882:                klicnt[0]++;
                    883:        else
                    884:                klocnt[0]++;
                    885:        *pkl = 1;
                    886:        if (noklust || klsize <= 1 || klsize > KLMAX || (klsize & (klsize - 1)))
                    887:                return (v);
                    888:        if (rw == B_READ && freemem < CLSIZE * KLMAX)
                    889:                return (v);
                    890:        if (isassv(p, v)) {
                    891:                type = CSTACK;
                    892:                cl = vtosp(p, v) / CLSIZE;
                    893:                clmax = p->p_ssize / CLSIZE;
                    894:        } else if (isadsv(p, v)) {
                    895:                type = CDATA;
                    896:                cl = vtodp(p, v) / CLSIZE;
                    897:                clmax = p->p_dsize / CLSIZE;
                    898:        } else {
                    899:                type = CTEXT;
                    900:                cl = vtotp(p, v) / CLSIZE;
                    901:                clmax = p->p_textp->x_size / CLSIZE;
                    902:        }
                    903:        kloff = cl & (klsize - 1);
                    904:        pte = pte0;
                    905:        bn = bn0;
                    906:        for (k = kloff; --k >= 0;) {
                    907:                if (type == CSTACK)
                    908:                        pte += CLSIZE;
                    909:                else
                    910:                        pte -= CLSIZE;
                    911:                if (type == CTEXT && rw == B_READ && bn) {
                    912:                        bn--;
                    913:                        if (mfind(MSWAPX, bn))
                    914:                                break;
                    915:                }
                    916:                if (!klok(pte, rw))
                    917:                        break;
                    918:        }
                    919:        klback = (kloff - k) - 1;
                    920:        pte = pte0;
                    921:        if ((cl - kloff) + klsize > clmax)
                    922:                klmax = clmax - (cl - kloff);
                    923:        else
                    924:                klmax = klsize;
                    925:        bn = bn0;
                    926:        for (k = kloff; ++k < klmax;) {
                    927:                if (type == CSTACK)
                    928:                        pte -= CLSIZE;
                    929:                else
                    930:                        pte += CLSIZE;
                    931:                if (type == CTEXT && rw == B_READ && bn) {
                    932:                        bn++;
                    933:                        if (mfind(MSWAPX, bn))
                    934:                                break;
                    935:                }
                    936:                if (!klok(pte, rw))
                    937:                        break;
                    938:        }
                    939:        klforw = (k - kloff) - 1;
                    940:        if (klforw + klback == 0)
                    941:                return (v);
                    942:        pte = pte0;
                    943:        if (type == CSTACK) {
                    944:                pte -= klforw * CLSIZE;
                    945:                v -= klforw * CLSIZE;
                    946:        } else {
                    947:                pte -= klback * CLSIZE;
                    948:                v -= klback * CLSIZE;
                    949:        }
                    950:        *pkl = klforw + klback + 1;
                    951:        if (rw == B_READ)
                    952:                klicnt[0]--, klicnt[*pkl - 1]++;
                    953:        else
                    954:                klocnt[0]--, klocnt[*pkl - 1]++;
                    955:        v0 = v;
                    956:        for (i = 0; i < *pkl; i++) {
                    957:                if (pte == pte0)
                    958:                        goto cont;
                    959:                if (rw == B_WRITE) {
                    960:                        mlock(pte->pg_pfnum);
                    961:                        if (anycl(pte, pg_m)) {
                    962:                                pte->pg_m = 0;
                    963:                        }
                    964:                        pte->pg_swapm = 0;
                    965:                        distcl(pte);
                    966:                        if (type == CTEXT)
                    967:                                distpte(p->p_textp, vtotp(p, v), pte);
                    968:                } else {
                    969:                        struct pte opte;
                    970:                        int pf;
                    971: 
                    972:                        opte = *pte;
                    973:                        if (memall(pte, CLSIZE, p, type) == 0)
                    974:                                panic("kluster");
                    975:                        pte->pg_prot = opte.pg_prot;
                    976:                        pf = pte->pg_pfnum;
                    977:                        cmap[pgtocm(pf)].c_intrans = 1;
                    978:                        distcl(pte);
                    979:                        if (type == CTEXT) {
                    980:                                p->p_textp->x_rssize += CLSIZE;
                    981:                                distpte(p->p_textp, vtotp(p, v), pte);
                    982:                        } else
                    983:                                p->p_rssize += CLSIZE;
                    984:                        distcl(pte);
                    985:                }
                    986: cont:
                    987:                pte += CLSIZE;
                    988:                v += CLSIZE;
                    989:        }
                    990:        return (v0);
                    991: }
                    992: 
                    993: klok(pte, rw)
                    994:        register struct pte *pte;
                    995:        int rw;
                    996: {
                    997:        register struct cmap *c;
                    998: 
                    999:        if (rw == B_WRITE) {
                   1000:                if (pte->pg_fod)
                   1001:                        return (0);
                   1002:                if (pte->pg_pfnum == 0)
                   1003:                        return (0);
                   1004:                c = &cmap[pgtocm(pte->pg_pfnum)];
                   1005:                if (c->c_lock || c->c_intrans)
                   1006:                        return (0);
                   1007:                if (!dirtycl(pte))
                   1008:                        return (0);
                   1009:                return (1);
                   1010:        } else {
                   1011:                if (pte->pg_fod)
                   1012:                        return (0);
                   1013:                if (pte->pg_pfnum)
                   1014:                        return (0);
                   1015:                return (1);
                   1016:        }
                   1017: }

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.