Annotation of pgp/src/language.c, revision 1.1.1.1

1.1       root        1: /*
                      2:  *     language.c - Foreign language translation for PGP
                      3:  *     Finds foreign language "subtitles" for English phrases 
                      4:  *     in external foriegn language text file.
                      5:  */
                      6: 
                      7: #include <stdio.h>
                      8: #include <stdlib.h>
                      9: #include <string.h>
                     10: #include <ctype.h>
                     11: #include "usuals.h"
                     12: #include "fileio.h"
                     13: #include "language.h"
                     14: #include "pgp.h"
                     15: 
                     16: #define SUBTITLES_FILE "language.txt"
                     17: #define LANG_INDEXFILE "language.idx"
                     18: 
                     19: #define        STRBUFSIZE              2048
                     20: 
                     21: char language[16] = "en";      /* The language code, defaults to English */
                     22: static char    *strbuf;
                     23: static char    lang[16];       /* readstr sets this to the language id of the msg it last read */
                     24: static int     subtitles_available = 0;
                     25: static int line = 0;
                     26: /*     subtitles_available is used to determine if we know whether the special
                     27:        subtitles_file exists.  subtitles_available has the following values:
                     28:        0  = first time thru, we don't yet know if subtitles_file exists.
                     29:        1  = we have already determined that subtitles_file exists.
                     30:        -1 = we have already determined that subtitles_file does not exist.
                     31: */
                     32: 
                     33: #define        NEWLINE         0
                     34: #define        COMMENT         1
                     35: #define        INSTRING        2
                     36: #define        ESCAPE          3
                     37: #define        IDENT           4
                     38: #define        DONE            5
                     39: #define        ERROR           6
                     40: #define        ERR1            7
                     41: 
                     42: /* Look for and return a quoted string from the file.
                     43:  * If nlabort is true, return failure if we find a blank line
                     44:  * before we find the opening quote.
                     45:  */
                     46: static char    *
                     47: readstr (FILE *f, char *buf, int nlabort)
                     48: {      int             c, d;
                     49:        char *p = buf;
                     50:        int state = NEWLINE;
                     51:        int i = 0;
                     52:        
                     53:        while ((c = getc(f)) != EOF)
                     54:        {
                     55:                if (c == '\r')
                     56:                        continue;
                     57:                /* line numbers are only incremented when creating index file */
                     58:                if (line && c == '\n')
                     59:                        ++line;
                     60:                switch (state)
                     61:                {
                     62:                        case NEWLINE:
                     63:                                switch(c)
                     64:                                {
                     65:                                        case '#': state = COMMENT; break;
                     66:                                        case '"': state = INSTRING; break;
                     67:                                        case '\n':
                     68:                                                if (nlabort)
                     69:                                                {       *buf = '\0';
                     70:                                                        return(buf);
                     71:                                                }
                     72:                                        default:
                     73:                                                if (i == 0 && isalnum(c))
                     74:                                                {
                     75:                                                        state = IDENT;
                     76:                                                        lang[i++] = c;
                     77:                                                        break;
                     78:                                                }
                     79:                                                if (!isspace(c))
                     80:                                                {
                     81:                                                        fprintf(stderr, "language.txt:%d: syntax error\n", line);
                     82:                                                        state = ERROR;
                     83:                                                }
                     84:                                }
                     85:                                break;
                     86:                        case COMMENT:
                     87:                                if (c == '\n')
                     88:                                        state = NEWLINE;
                     89:                                break;
                     90:                        case INSTRING:
                     91:                                switch(c)
                     92:                                {
                     93:                                        case '\\': state = ESCAPE; break;
                     94:                                        case '"': state = DONE; break;
                     95:                                        default: *p++ = c;
                     96:                                }
                     97:                                break;
                     98:                        case ESCAPE:
                     99:                                switch (c)
                    100:                                {
                    101:                                        case 'n':       *p++ = '\n';    break;
                    102:                                        case 'r':       *p++ = '\r';    break;
                    103:                                        case 't':       *p++ = '\t';    break;
                    104:                                        case 'e':       *p++ = '\033';  break;
                    105:                                        case 'a':       *p++ = '\007';  break;
                    106:                                        case '#':
                    107:                                        case '"':
                    108:                                        case '\\':      *p++ = c; break;
                    109:                                        case '\n':      break;
                    110:                                        case '0':
                    111:                                                        d = 0;
                    112:                                                        while ((c = fgetc(f)) >= '0' && c <= '7')
                    113:                                                                d = 8 * d + c - '0';
                    114:                                                        *p++ = d;
                    115:                                                        ungetc(c, f);
                    116:                                                        break;
                    117:                                        default:
                    118:                                                        fprintf(stderr, "language.txt:%d: illegal escape sequence: '\\%c'\n", line, c);
                    119:                                                        break;
                    120:                                }
                    121:                                state = INSTRING;
                    122:                                break;
                    123:                        case IDENT:             /* language identifier */
                    124:                                if (c == ':') {
                    125:                                        state = NEWLINE;
                    126:                                        break;
                    127:                                }
                    128:                                if (c == '\n' && strncmp(lang, "No translation", 14) == 0)
                    129:                                {
                    130:                                        i = 0;
                    131:                                        state = NEWLINE;
                    132:                                        break;
                    133:                                }
                    134:                                lang[i++] = c;
                    135:                                if (i == 15 || !isalnum(c) && !isspace(c))
                    136:                                {
                    137:                                        lang[i] = '\0';
                    138:                                        fprintf(stderr, "language.txt:%d: bad language identifier: '%s'\n", line, lang);
                    139:                                        state = ERROR;
                    140:                                        i = 0;
                    141:                                }
                    142:                                break;
                    143:                        case DONE:
                    144:                                if (c == '\n')
                    145:                                {
                    146:                                        lang[i] = '\0';
                    147:                                        *p = '\0';
                    148:                                        return(buf);
                    149:                                }
                    150:                                if (!isspace(c))
                    151:                                {
                    152:                                        fprintf(stderr, "language.txt:%d: extra characters after '\"'\n", line);
                    153:                                        state = ERROR;
                    154:                                }
                    155:                                break;
                    156:                        case ERROR:
                    157:                                if (c == '\n')
                    158:                                        state = ERR1;
                    159:                                break;
                    160:                        case ERR1:
                    161:                                state = (c == '\n' ? NEWLINE : ERROR);
                    162:                                break;
                    163:                }
                    164:        }
                    165:        if (state != NEWLINE)
                    166:                fprintf(stderr, "language.txt: unexpected EOF\n");
                    167:        return(NULL);
                    168: }
                    169: 
                    170: #ifdef TEST
                    171: main()
                    172: {
                    173:        char buf[2048];
                    174: 
                    175:        line = 1;
                    176:        while (readstr(stdin, buf, 0)) {
                    177:                printf("\nen: <%s>\n", buf);
                    178:                while (readstr(stdin, buf, 1) && *buf != '\0')
                    179:                        printf("%s: <%s>\n", lang, buf);
                    180:        }
                    181:        exit(0);
                    182: }
                    183: #else
                    184: 
                    185: static struct indx_ent {
                    186:        word32  crc;
                    187:        long    offset;
                    188: } *indx_tbl = NULL;
                    189: 
                    190: static int max_msgs = 0;
                    191: static int nmsg = 0;
                    192: 
                    193: static FILE *langf;
                    194: 
                    195: static void init_lang();
                    196: static int make_indexfile(char *);
                    197: word32 crcupdate(byte, word32);
                    198: void init_crc();
                    199: 
                    200: /*
                    201:  * uses 24-bit CRC function from armor.c
                    202:  */
                    203: static word32
                    204: message_crc(char *s)
                    205: {
                    206:        word32 crc = 0;
                    207: 
                    208:        while (*s)
                    209:                crc = crcupdate(*s++, crc);
                    210:        return(crc);
                    211: }
                    212: 
                    213: /*
                    214:  * lookup file offset in indx_tbl
                    215:  */
                    216: static long
                    217: lookup_offset(word32 crc)
                    218: {
                    219:        int i;
                    220:        
                    221:        for (i = 0; i < nmsg; ++i)
                    222:                if (indx_tbl[i].crc == crc)
                    223:                        return(indx_tbl[i].offset);
                    224:        return(-1);
                    225: }
                    226: 
                    227: 
                    228: /*
                    229:  * return foreign translation of s
                    230:  */
                    231: char *
                    232: PSTR (char *s)
                    233: {
                    234:        long filepos;
                    235: 
                    236:        if (subtitles_available == 0)
                    237:                init_lang();
                    238:        if (subtitles_available < 0)
                    239:                return(s);
                    240: 
                    241:        filepos = lookup_offset(message_crc(s));
                    242:        if (filepos == -1)
                    243:                return(s);
                    244:        else
                    245:        {
                    246:                fseek(langf, filepos, SEEK_SET);
                    247:                readstr(langf, strbuf, 1);
                    248:        }
                    249: 
                    250:        if (strbuf[0] == '\0')
                    251:                return(s);
                    252: 
                    253:        for (s = strbuf; *s; ++s)
                    254:                *s = EXT_C(*s);
                    255:        return(strbuf);
                    256: }
                    257: 
                    258: 
                    259: static struct {
                    260:        long lang_fsize;        /* size of language.txt */
                    261:        char lang[16];          /* language identifier */
                    262:        int nmsg;                       /* number of messages */
                    263: } indx_hdr;
                    264: 
                    265: 
                    266: /*
                    267:  * initialize the index table: read it from language.idx or create
                    268:  * a new one and write it to the index file. A new index file is
                    269:  * created if the language set in config.pgp doesn't match the one
                    270:  * in language.idx or if the size of language.txt has changed.
                    271:  */
                    272: static void
                    273: init_lang()
                    274: {
                    275:        char indexfile[MAX_PATH];
                    276:        char subtitles_file[MAX_PATH];
                    277:        FILE *indexf;
                    278: 
                    279:        if (strcmp(language, "en") == 0)
                    280:        {       subtitles_available = -1;
                    281:                return;         /* use default messages */
                    282:        }
                    283: 
                    284:        buildfilename (subtitles_file, SUBTITLES_FILE);
                    285:        if ((langf = fopenbin(subtitles_file, "r")) == NULL)
                    286:        {
                    287:                subtitles_available = -1;
                    288:                return;
                    289:        }
                    290:        init_crc();
                    291:        if ((strbuf = (char *) malloc(STRBUFSIZE)) == NULL)
                    292:        {
                    293:                fprintf(stderr, "Not enough memory for foreign subtitles\n");
                    294:                fclose(langf);
                    295:                subtitles_available = -1;
                    296:                return;
                    297:        }
                    298:        buildfilename(indexfile, LANG_INDEXFILE);
                    299:        if ((indexf = fopenbin(indexfile, "r")) != NULL)
                    300:        {
                    301:                if (fread(&indx_hdr, 1, sizeof(indx_hdr), indexf) == sizeof(indx_hdr) &&
                    302:                        indx_hdr.lang_fsize == fsize(langf) &&
                    303:                        strcmp(indx_hdr.lang, language) == 0)
                    304:                {
                    305:                        nmsg = indx_hdr.nmsg;
                    306:                        indx_tbl = (struct indx_ent *) malloc(nmsg * sizeof(struct indx_ent));
                    307:                        if (indx_tbl == NULL)
                    308:                        {
                    309:                                fprintf(stderr, "Not enough memory for foreign subtitles\n");
                    310:                                fclose(indexf);
                    311:                                fclose(langf);
                    312:                                subtitles_available = -1;
                    313:                                return;
                    314:                        }
                    315:                        if (fread(indx_tbl, sizeof(struct indx_ent), nmsg, indexf) != nmsg)
                    316:                        {
                    317:                                free(indx_tbl); /* create a new one */
                    318:                                indx_tbl = NULL;
                    319:                        }
                    320:                }
                    321:                fclose(indexf);
                    322:        }
                    323:        if (indx_tbl == NULL && make_indexfile(indexfile) < 0)
                    324:        {
                    325:                fclose(langf);
                    326:                subtitles_available = -1;
                    327:        }
                    328:        else
                    329:                subtitles_available = 1;
                    330: }
                    331: 
                    332: 
                    333: static int
                    334: make_indexfile(char *indexfile)
                    335: {
                    336:        FILE *indexf;
                    337:        long filepos;
                    338:        int total_msgs = 0;
                    339:        char *res;
                    340: 
                    341:        if (verbose)    /* must be set in config.pgp */
                    342:                fprintf(stderr, "Creating language index file '%s' for language \"%s\"\n",
                    343:                                indexfile, language);
                    344:        rewind(langf);
                    345:        indx_hdr.lang_fsize = fsize(langf);
                    346:        strncpy(indx_hdr.lang, language, 15);
                    347:        init_crc();
                    348:        line = 1;
                    349:        nmsg = 0;
                    350:        while (readstr(langf, strbuf, 0))
                    351:        {
                    352:                if (nmsg == max_msgs)
                    353:                {
                    354:                        if (max_msgs)
                    355:                        {       max_msgs *= 2;
                    356:                                indx_tbl = (struct indx_ent *) realloc(indx_tbl, max_msgs *
                    357:                                                        sizeof(struct indx_ent));
                    358:                        }
                    359:                        else
                    360:                        {       max_msgs = 400;
                    361:                                indx_tbl = (struct indx_ent *) malloc(max_msgs *
                    362:                                                        sizeof(struct indx_ent));
                    363:                        }
                    364:                        if (indx_tbl == NULL)
                    365:                        {
                    366:                                fprintf(stderr, "Not enough memory for foreign subtitles\n");
                    367:                                return(-1);
                    368:                        }
                    369:                }
                    370:                ++total_msgs;
                    371:                indx_tbl[nmsg].crc = message_crc(strbuf);
                    372:                if (lookup_offset(indx_tbl[nmsg].crc) != -1)
                    373:                        fprintf(stderr, "language.txt:%d: Message CRC not unique: \"%s\"\n",
                    374:                                        line, strbuf);
                    375:                do
                    376:                {
                    377:                        filepos = ftell(langf);
                    378:                        res = readstr (langf, strbuf, 1);               /* Abort if find newline first */
                    379:                } while (res && strbuf[0] != '\0' && strcmp(language, lang) != 0);
                    380: 
                    381:                if (res == NULL)
                    382:                        break;
                    383:                if (strbuf[0] == '\0')  /* No translation */
                    384:                        continue;
                    385: 
                    386:                indx_tbl[nmsg].offset = filepos;
                    387:                ++nmsg;
                    388:                do
                    389:                        res = readstr (langf, strbuf, 1);               /* Abort if find newline first */
                    390:                while (res && strbuf[0] != '\0');
                    391:        }
                    392:        line = 0;
                    393:        indx_hdr.nmsg = nmsg;
                    394:        if (nmsg == 0)
                    395:        {       fprintf(stderr, "No translations available for language \"%s\"\n\n",
                    396:                                language);
                    397:                return(-1);
                    398:        }
                    399:        if (verbose || total_msgs != nmsg)
                    400:                fprintf(stderr, "%d messages, %d translations\n\n", total_msgs, nmsg);
                    401: 
                    402:        if ((indexf = fopenbin(indexfile, "w")) == NULL)
                    403:                fprintf(stderr, "Cannot create %s\n", indexfile);
                    404:        else
                    405:        {
                    406:                fwrite(&indx_hdr, 1, sizeof(indx_hdr), indexf);
                    407:                fwrite(indx_tbl, sizeof(struct indx_ent), nmsg, indexf);
                    408:                if (ferror(indexf) || fclose(indexf))
                    409:                        fprintf(stderr, "error writing %s\n", indexfile);
                    410:        }
                    411:        return(0);
                    412: }
                    413: #endif /* TEST */

unix.superglobalmegacorp.com

This archive runs on limited infrastructure. Preserving old code on modern bandwidth. Automated agents are requested to crawl responsibly.