Загрузить файлы ''

2020-05-17 21:02:31 +00:00 · 2020-05-17 21:02:31 +00:00 · 51a037c48b
commit 51a037c48b
parent 630d3a1d6f
5 changed files with 20339 additions and 0 deletions
--- a/Bot.py
+++ b/Bot.py
@ -0,0 +1,90 @@
 from telegram import Bot
 from telegram import Update
 from telegram.ext import Updater
 from telegram.ext import MessageHandler
 from telegram.ext import Filters
 from pickle import load
 from keras.models import load_model
 from keras.utils import to_categorical
 from keras.preprocessing.sequence import pad_sequences
 def generate_seq(model, mapping, seq_length, seed_text, n_chars):
    in_text = seed_text
    # generate a fixed number of characters
    for _ in range(n_chars):
        # encode the characters as integers
        encoded = [mapping[char] for char in in_text]
        # truncate sequences to a fixed length
        encoded = pad_sequences([encoded], maxlen=seq_length, truncating='pre')
        # one hot encode
        encoded = to_categorical(encoded, num_classes=len(mapping))
        # predict character
        yhat = model.predict_classes(encoded, verbose=0)
        # reverse map integer to character
        out_char = ''
        for char, index in mapping.items():
            if index == yhat:
                out_char = char
                break
        # append to input
        if char == ' ':
            char = '_'
        in_text += char
    return in_text
 TG_TOKEN = "1011115574:AAHLaC4jgtkYGxL9wILnMjmTxsHLIqsGDZE"
 BUFF = ''
 def message_handler(bot: Bot, update: Update):
    sim = 5
    model = load_model('model.h5')
    global BUFF
    # load the mapping
    mapping = load(open('mapping.pkl', 'rb'))
    user = update.effective_user
    bot.send_message(chat_id=update.effective_message.chat_id,
                     text="Введи начало никнейма")
    text = update.effective_message.text
    text_in = BUFF + text
    nike = generate_seq(model, mapping, 10, text_in, sim)
    nik = ''
    iterator = (sim + len(text))*-1
    while iterator != 0:
        nik += nike[iterator]
        iterator += 1
    replay_text = f'{nik}'
    bot.send_message(chat_id=update.effective_message.chat_id,
                     text=replay_text)
    BUFF += nik
    return
 def main():
    bot = Bot(
        token=TG_TOKEN,
    )
    updater = Updater(
        bot=bot,
    )
    hendler = MessageHandler(Filters.all, message_handler)
    updater.dispatcher.add_handler(hendler)
    updater.start_polling()
    updater.idle()
 if __name__ == '__main__':
    main()
--- a/Create_Model.py
+++ b/Create_Model.py
@ -0,0 +1,59 @@
 from numpy import array
 from pickle import dump
 from keras.utils import to_categorical
 from keras.models import Sequential
 from keras.layers import Dense
 from keras.layers import LSTM
 # load doc into memory
 def load_doc(filename):
    # open the file as read only
    file = open(filename, 'r')
    # read all text
    text = file.read()
    # close the file
    file.close()
    return text
 # load
 in_filename = 'char_sequences.txt'
 raw_text = load_doc(in_filename)
 lines = raw_text.split('\n')
 # integer encode sequences of characters
 chars = sorted(list(set(raw_text)))
 mapping = dict((c, i) for i, c in enumerate(chars))
 sequences = list()
 for line in lines:
    # integer encode line
    encoded_seq = [mapping[char] for char in line]
    # store
    sequences.append(encoded_seq)
 # vocabulary size
 vocab_size = len(mapping)
 print('Vocabulary Size: %d' % vocab_size)
 # separate into input and output
 sequences = array(sequences)
 X, y = sequences[:, :-1], sequences[:, -1]
 sequences = [to_categorical(x, num_classes=vocab_size) for x in X]
 X = array(sequences)
 y = to_categorical(y, num_classes=vocab_size)
 # define model
 model = Sequential()
 model.add(LSTM(75, input_shape=(X.shape[1], X.shape[2])))
 model.add(Dense(vocab_size, activation='softmax'))
 print(model.summary())
 # compile model
 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
 # fit model
 model.fit(X, y, epochs=100, verbose=2)
 # save the model to file
 model.save('model.h5')
 # save the mapping
 dump(mapping, open('mapping.pkl', 'wb'))
--- a/Create_data.py
+++ b/Create_data.py
@ -0,0 +1,40 @@
 # load doc into memory
 def load_doc(filename):
    # open the file as read only
    file = open(filename, 'r')
    # read all text
    text = file.read()
    # close the file
    file.close()
    return text
 # save tokens to file, one dialog per line
 def save_doc(lines, filename):
    data = '\n'.join(lines)
    file = open(filename, 'w')
    file.write(data)
    file.close()
 # load text
 raw_text = load_doc('rhyme.txt')
 print(raw_text)
 # clean
 tokens = raw_text.split()
 raw_text = ' '.join(tokens)
 # organize into sequences of characters
 length = 10
 sequences = list()
 for i in range(length, len(raw_text)):
    # select sequence of tokens
    seq = raw_text[i - length:i + 1]
    # store
    sequences.append(seq)
 print('Total Sequences: %d' % len(sequences))
 # save sequences to file
 out_filename = 'char_sequences.txt'
 save_doc(sequences, out_filename)
--- a/Generate.py
+++ b/Generate.py
@ -0,0 +1,42 @@
 from pickle import load
 from keras.models import load_model
 from keras.utils import to_categorical
 from keras.preprocessing.sequence import pad_sequences
 # generate a sequence of characters with a language model
 def generate_seq(model, mapping, seq_length, seed_text, n_chars):
    in_text = seed_text
    # generate a fixed number of characters
    for _ in range(n_chars):
        # encode the characters as integers
        encoded = [mapping[char] for char in in_text]
        # truncate sequences to a fixed length
        encoded = pad_sequences([encoded], maxlen=seq_length, truncating='pre')
        # one hot encode
        encoded = to_categorical(encoded, num_classes=len(mapping))
        # predict character
        yhat = model.predict_classes(encoded, verbose=0)
        # reverse map integer to character
        out_char = ''
        for char, index in mapping.items():
            if index == yhat:
                out_char = char
                break
        # append to input
        in_text += char
    return in_text
 # load the model
 model = load_model('model.h5')
 # load the mapping
 mapping = load(open('mapping.pkl', 'rb'))
 print(generate_seq(model, mapping, 10, 'Mar', 7))
--- a/char_sequences.txt
+++ b/char_sequences.txt