min-dalle-test/min_dalle/min_dalle.py

import os
import json
import numpy

from .text_tokenizer import TextTokenizer
from .load_params import load_vqgan_torch_params, load_dalle_bart_flax_params
from .models.vqgan_detokenizer import VQGanDetokenizer

class MinDalle:
    def __init__(self, is_mega: bool):
        self.is_mega = is_mega
        model_name = 'dalle_bart_{}'.format('mega' if is_mega else 'mini')
        model_path = os.path.join('pretrained', model_name)

        print("reading files from {}".format(model_path))
        with open(os.path.join(model_path, 'config.json'), 'r') as f: 
            self.config = json.load(f)
        with open(os.path.join(model_path, 'vocab.json'), 'r') as f:
            vocab = json.load(f)
        with open(os.path.join(model_path, 'merges.txt'), 'r') as f:
            merges = f.read().split("\n")[1:-1]
        self.model_params = load_dalle_bart_flax_params(model_path)

        self.tokenizer = TextTokenizer(vocab, merges)
        self.detokenizer = VQGanDetokenizer()
        vqgan_params = load_vqgan_torch_params('./pretrained/vqgan')
        self.detokenizer.load_state_dict(vqgan_params)


    def tokenize_text(self, text: str) -> numpy.ndarray:
        print("tokenizing text")
        tokens = self.tokenizer.tokenize(text)
        print("text tokens", tokens)
        text_token_count = self.config['max_text_length']
        text_tokens = numpy.ones((2, text_token_count), dtype=numpy.int32)
        text_tokens[0, :len(tokens)] = tokens
        text_tokens[1, :2] = [tokens[0], tokens[-1]]
        return text_tokens
refactored to load models once and run multiple times 2022-06-29 13:42:12 +00:00			`import os`
			`import json`
			`import numpy`

			`from .text_tokenizer import TextTokenizer`
			`from .load_params import load_vqgan_torch_params, load_dalle_bart_flax_params`
			`from .models.vqgan_detokenizer import VQGanDetokenizer`

			`class MinDalle:`
			`def __init__(self, is_mega: bool):`
			`self.is_mega = is_mega`
			`model_name = 'dalle_bart_{}'.format('mega' if is_mega else 'mini')`
			`model_path = os.path.join('pretrained', model_name)`

			`print("reading files from {}".format(model_path))`
			`with open(os.path.join(model_path, 'config.json'), 'r') as f:`
			`self.config = json.load(f)`
			`with open(os.path.join(model_path, 'vocab.json'), 'r') as f:`
			`vocab = json.load(f)`
			`with open(os.path.join(model_path, 'merges.txt'), 'r') as f:`
			`merges = f.read().split("\n")[1:-1]`
			`self.model_params = load_dalle_bart_flax_params(model_path)`

			`self.tokenizer = TextTokenizer(vocab, merges)`
			`self.detokenizer = VQGanDetokenizer()`
			`vqgan_params = load_vqgan_torch_params('./pretrained/vqgan')`
			`self.detokenizer.load_state_dict(vqgan_params)`


			`def tokenize_text(self, text: str) -> numpy.ndarray:`
			`print("tokenizing text")`
			`tokens = self.tokenizer.tokenize(text)`
			`print("text tokens", tokens)`
			`text_token_count = self.config['max_text_length']`
			`text_tokens = numpy.ones((2, text_token_count), dtype=numpy.int32)`
			`text_tokens[0, :len(tokens)] = tokens`
			`text_tokens[1, :2] = [tokens[0], tokens[-1]]`
			`return text_tokens`