Crear chatbot - JO PARIS 4 - Programación

Página delantera > Programación > Crear chatbot - JO PARIS 4

Crear chatbot - JO PARIS 4

Publicado el 2024-08-31

Navegar:590

Create chat bot - JO PARIS 4

En este artículo, muestro cómo crear un bot de chat simple con tensorflow.

Para los datos, utilizo un conjunto de datos kaggle de PARIS JO JO 2024 para obtener oraciones en la etapa de entrenamiento.

Puedes obtener el código de finalización en mi github: https://github.com/victordalet/Kaggle_analysis/tree/feat/paris_2024_olympics

I: conjunto de datos del bot de chat predeterminado

Un conjunto de datos de tensorflow en bots de chat se ve así.
Podemos encontrar una etiqueta, un patrón y las distintas respuestas.
Nuestro objetivo será agregar las diferentes secuencias del conjunto de datos de apuestas de JO y agregarlas a un archivo como este.

{
  "intents": [
    {
      "tag": "google",
      "patterns": [
        "google",
        "search",
        "internet"
      ],
      "responses": [
        "Redirecting to Google..."
      ]
    },

II - Tratamiento de datos

Leí un conjunto de datos de bot de chat en json predeterminado y csv de JO, lo dividí y lo procesé para agregar la oración en json

import json


class CreateDataset:
    def __init__(self):
        self.json_path = 'data.json'
        self.csv_path = '../paris-2024-faq.csv'
        with open(self.json_path) as file:
            self.dataset = json.load(file)
        f = open(self.csv_path, 'r')
        dataset_split = f.read().split(";")
        question = False
        for data in dataset_split:
            if question:
                question = False
                self.dataset["intents"][-1]["responses"].append(data)

            if "?" in data:
                question = True
                self.dataset["intents"].append({
                    "tag": "",
                    "patterns": [
                        data
                    ],
                    "responses": [
                    ]
                })
        with open(self.json_path, 'w') as f:
            json.dump(self.dataset, f)

III - Formación

Para fines de capacitación, edité un ejemplo de tensorflow.
Si toma mi código para ejecutarlo, agregue en el primer argumento la cantidad de épocas que desee.
Cree un directorio para guardar donde irá su modelo y agregue dentro los archivos clases.pkl y palabras.pkl que están en github como al principio de este artículo.

import random
import json
import pickle
import numpy as np
import sys

import nltk
from nltk.stem import WordNetLemmatizer

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.optimizers import SGD


class Train:
    words: list
    classes: list
    documents: list
    ignore_letters: list
    training: list
    output_empty: list
    train_x: list
    train_y: list
    model: Sequential
    epochs: int

    def __init__(self):
        self.lemmatizer = WordNetLemmatizer()
        self.intents = json.loads(open('data.json').read())
        self.words = []
        self.classes = []
        self.documents = []
        self.training = []
        self.ignore_letters = ['?', '!']
        self.epochs = int(sys.argv[1])

    def run(self):
        self.download_nltk_data()
        self.load_training_data()
        self.prepare_training_data()
        self.build_neural_network()
        self.train()

    @staticmethod
    def download_nltk_data():
        nltk.download('punkt')
        nltk.download('wordnet')

    def load_training_data(self):
        for intent in self.intents['intents']:
            for pattern in intent['patterns']:
                word_list = nltk.word_tokenize(pattern)
                self.words.extend(word_list)
                self.documents.append((word_list, intent['tag']))
                if intent['tag'] not in self.classes:
                    self.classes.append(intent['tag'])

    def prepare_training_data(self):
        self.words = [self.lemmatizer.lemmatize(word)
                      for word in self.words
                      if word not in self.ignore_letters]

        self.words = sorted(set(self.words))
        self.classes = sorted(set(self.classes))
        pickle.dump(self.words, open('saves/words.pkl', 'wb'))
        pickle.dump(self.classes, open('saves/classes.pkl', 'wb'))

        self.output_empty = [0] * len(self.classes)
        for document in self.documents:
            bag = []
            word_patterns = document[0]
            word_patterns = [self.lemmatizer.lemmatize(word.lower())
                             for word in word_patterns]
            for word in self.words:
                bag.append(1) if word in word_patterns else bag.append(0)

            output_row = list(self.output_empty)
            output_row[self.classes.index(document[1])] = 1
            self.training.append([bag, output_row])

        random.shuffle(self.training)
        self.training = np.array(self.training)

        self.train_x = list(self.training[:, 0])
        self.train_y = list(self.training[:, 1])

    def build_neural_network(self):
        self.model = Sequential()
        self.model.add(Dense(128, input_shape=(len(self.train_x[0]),),
                             activation='relu'))
        self.model.add(Dropout(0.5))
        self.model.add(Dense(64, activation='relu'))
        self.model.add(Dropout(0.5))
        self.model.add(Dense(len(self.train_y[0]), activation='softmax'))

        sgd = SGD(lr=0.01, momentum=0.9, nesterov=True)
        self.model.compile(loss='categorical_crossentropy',
                           optimizer=sgd,
                           metrics=['accuracy'])

    def train(self):
        self.model.fit(np.array(self.train_x),
                       np.array(self.train_y),
                       epochs=self.epochs,
                       batch_size=5,
                       verbose=1)
        self.model.save('saves/chatbot_model.model')


if __name__ == "__main__":
    Train().run()

IV - Prueba

Creo una clase ChatBot, con un método de prueba que recibe un mensaje aleatorio.
Puedes usar el método get_response para agregar este chatbot a tu aplicación, por ejemplo, lo llamo en uno de mis proyectos en una API de flask para tener mi chatbot en un sitio web.

import random
import json
import pickle
import numpy as np

import nltk
from nltk.stem import WordNetLemmatizer
from tensorflow.keras.models import load_model


class ChatBot:
    lemmatizer: WordNetLemmatizer
    intents: dict
    words: list
    classes: list
    model: load_model
    ERROR_THRESHOLD = 0.25

    def __init__(self):
        self.download_nltk_data()
        self.lemmatizer = WordNetLemmatizer()
        self.intents = json.loads(open('data.json').read())
        self.words = pickle.load(open('saves/words.pkl', 'rb'))
        self.classes = pickle.load(open('saves/classes.pkl', 'rb'))
        self.model = load_model('saves/chatbot_model.model')

    @staticmethod
    def download_nltk_data():
        nltk.download('punkt')
        nltk.download('wordnet')

    def clean_up_sentence(self, sentence):
        sentence_words = nltk.word_tokenize(sentence)
        sentence_words = [self.lemmatizer.lemmatize(word)
                          for word in sentence_words]
        return sentence_words

    def bag_of_words(self, sentence):
        sentence_words = self.clean_up_sentence(sentence)
        bag = [0] * len(self.words)
        for w in sentence_words:
            for i, word in enumerate(self.words):
                if word == w:
                    bag[i] = 1
        return np.array(bag)

    def predict_class(self, sentence):
        bow = self.bag_of_words(sentence)
        res = self.model.predict(np.array([bow]))[0]
        results = [[i, r]
                   for i, r in enumerate(res)
                   if r > self.ERROR_THRESHOLD]
        results.sort(key=lambda x: x[1], reverse=True)
        return_list = []
        for r in results:
            return_list.append({'intent': self.classes[r[0]],
                                'probability': str(r[1])})
        return return_list

    def get_response(self, intents_list):
        intents_json = self.intents
        tag = intents_list[0]['intent']
        list_of_intents = intents_json['intents']
        for i in list_of_intents:
            if i['tag'] == tag:
                result = random.choice(i['responses'])
                break
        return result

    def test(self):
        while True:
            message = input("")
            ints = self.predict_class(message)
            res = self.get_response(ints)
            print(res)

Declaración de liberación Este artículo se reproduce en: https://dev.to/victordalet/create-chat-bot-jo-paris-2024-4dnf?1 Si hay alguna infracción, comuníquese con [email protected] para eliminarla.

Último tutorial Más>

¿Cómo combino dos matrices asociativas en PHP mientras conservo ID únicas y manejo nombres duplicados?
Combinando matrices asociativas en PHPEn PHP, combinar dos matrices asociativas en una sola matriz es una tarea común. Considere la siguiente solicitu...

Programación Publicado el 2024-12-27
¿Por qué la solicitud POST no captura la entrada en PHP a pesar del código válido?
Solucionar el mal funcionamiento de la solicitud POST en PHPEn el fragmento de código presentado:action=''en lugar de:action="<?php echo $_SER...

Programación Publicado el 2024-12-27
¿Cómo puedo encontrar usuarios con los cumpleaños de hoy usando MySQL?
Cómo identificar usuarios con los cumpleaños de hoy usando MySQLDeterminar si hoy es el cumpleaños de un usuario usando MySQL implica encontrar todas ...

Programación Publicado el 2024-12-27
Uso de WebSockets en Go para comunicación en tiempo real
Crear aplicaciones que requieran actualizaciones en tiempo real, como aplicaciones de chat, notificaciones en vivo o herramientas colaborativas, requi...

Programación Publicado el 2024-12-27
Más allá de las declaraciones "if": ¿dónde más se puede utilizar un tipo con una conversión "bool" explícita sin conversión?
Conversión contextual a bool permitida sin conversiónSu clase define una conversión explícita a bool, lo que le permite usar su instancia 't' ...

Programación Publicado el 2024-12-26
$¿Cómo solucionar \"Configurado incorrectamente: Error al cargar el módulo MySQLdb\" en Django en macOS?$
¿Cómo solucionar \"Configurado incorrectamente: Error al cargar el módulo MySQLdb\" en Django en macOS?
MySQL configurado incorrectamente: el problema con las rutas relativasAl ejecutar python Manage.py RunServer en Django, puede encontrar el siguiente e...

Programación Publicado el 2024-12-26
Formación
Los métodos son fns que se pueden invocar en objetos Los arreglos son objetos, por lo tanto también tienen métodos en JS. segmento (comienzo):...

Programación Publicado el 2024-12-26
¿Qué pasó con la compensación de columnas en Bootstrap 4 Beta?
Bootstrap 4 Beta: eliminación y restauración del desplazamiento de columnasBootstrap 4, en su versión Beta 1, introdujo cambios significativos en la f...

Programación Publicado el 2024-12-26
¿Por qué C y C++ ignoran las longitudes de las matrices en las firmas de funciones?
Pasar matrices a funciones en C y C Pregunta:¿Por qué C y Los compiladores de C permiten declaraciones de longitud de matriz en firmas de funciones, c...

Programación Publicado el 2024-12-26
¿Cómo puedo eliminar acentos en MySQL para mejorar la búsqueda de autocompletar?
Eliminar acentos en MySQL para una búsqueda de autocompletar eficienteAl administrar una gran base de datos de nombres de lugares, es fundamental gara...

Programación Publicado el 2024-12-26
¿Cómo implementar claves externas compuestas en MySQL?
Implementación de claves externas compuestas en SQLUn diseño de base de datos común implica establecer relaciones entre tablas utilizando claves compu...

Programación Publicado el 2024-12-26
¿Por qué mis JComponents están ocultos detrás de una imagen de fondo en Java?
Depuración de JComponents ocultos por imagen de fondoAl trabajar con JComponents, como JLabels, en una aplicación Java, es esencial garantizar un comp...

Programación Publicado el 2024-12-26
¿Cómo convertir todo tipo de cotizaciones tipográficas en PHP?
Convierta todos los tipos de comillas tipográficas en PHPLas comillas tipográficas son marcas tipográficas que se utilizan en lugar de las comillas si...

Programación Publicado el 2024-12-26
¿Cuáles son las diferentes formas de recorrer una matriz de JavaScript?
Recorrer una matriz usando JavaScriptRecorrer en iteración los elementos de una matriz es una tarea común en JavaScript. Hay varios enfoques disponibl...

Programación Publicado el 2024-12-26
¿Cómo pausar eficientemente la ejecución de Selenium WebDriver en Python?
Declaraciones de espera y condicionales en Selenium WebDriverPregunta: ¿Cómo puedo pausar la ejecución de Selenium WebDriver durante milisegundos en P...

Programación Publicado el 2024-12-26

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo