Chunking in AI - La sauce secrète qui vous manque - La programmation

Page de garde > La programmation > Chunking in AI - La sauce secrète qui vous manque

Chunking in AI - La sauce secrète qui vous manque

Publié le 2024-11-08

Parcourir:676

Chunking in AI - The Secret Sauce You

Hé les amis ! ?

Tu sais ce qui m'empêche de dormir la nuit ? Réfléchir à la manière de rendre nos systèmes d’IA plus intelligents et plus efficaces. Aujourd'hui, je veux parler de quelque chose qui peut sembler basique mais qui est crucial lors de la création d'applications d'IA géniales : chunking ✨.

Qu'est-ce qui se passe de toute façon ? ?

Considérez le découpage comme un moyen utilisé par votre IA pour décomposer un énorme buffet d'informations en portions gérables et de la taille d'une bouchée. Tout comme vous n'essaieriez pas de mettre une pizza entière dans votre bouche d'un coup (ou peut-être que vous le feriez, sans jugement ici !), votre IA doit diviser les gros textes en morceaux plus petits pour les traiter efficacement.

Ceci est particulièrement important pour ce que nous appelons les modèles RAG (Retrieval-Augmented Generation). Ces mauvais garçons ne se contentent pas d'inventer des trucs : ils vont en fait chercher de vraies informations auprès de sources externes. Plutôt sympa, non ?

Pourquoi devriez-vous vous en soucier ? ?

Écoutez, si vous créez quelque chose qui traite du texte - qu'il s'agisse d'un chatbot de support client ou d'une recherche sophistiquée dans une base de connaissances - une bonne décomposition est la différence entre une IA qui donne des réponses précises et une qui est juste... . meh.

Des morceaux trop gros ? Votre modèle passe à côté de l'essentiel.
Des morceaux trop petits ? On se perd dans les détails.

Mettons-nous les mains dans le cambouis : exemples concrets ?

Exemple Python : regroupement sémantique

Tout d'abord, regardons un exemple Python utilisant LangChain pour le chunking sémantique :

from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import TextLoader

def semantic_chunk(file_path):
    # Load the document
    loader = TextLoader(file_path)
    document = loader.load()

    # Create a text splitter
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=200,
        length_function=len,
        separators=["\n\n", "\n", " ", ""]
    )

    # Split the document into chunks
    chunks = text_splitter.split_documents(document)

    return chunks

# Example usage
chunks = semantic_chunk('knowledge_base.txt')
for i, chunk in enumerate(chunks):
    print(f"Chunk {i}: {chunk.page_content[:50]}...")

Exemple Node.js et CDK : création d'une base de connaissances

Maintenant, construisons quelque chose de réel : une base de connaissances sans serveur utilisant AWS CDK et Node.js ! ?

Tout d'abord, l'infrastructure CDK (c'est là que la magie opère) :

import * as cdk from 'aws-cdk-lib';
import * as s3 from 'aws-cdk-lib/aws-s3';
import * as lambda from 'aws-cdk-lib/aws-lambda';
import * as opensearch from 'aws-cdk-lib/aws-opensearch';
import * as iam from 'aws-cdk-lib/aws-iam';

export class KnowledgeBaseStack extends cdk.Stack {
  constructor(scope: cdk.App, id: string, props?: cdk.StackProps) {
    super(scope, id, props);

    // S3 bucket to store our documents
    const documentBucket = new s3.Bucket(this, 'DocumentBucket', {
      removalPolicy: cdk.RemovalPolicy.DESTROY,
    });

    // OpenSearch domain for storing our chunks
    const openSearchDomain = new opensearch.Domain(this, 'DocumentSearch', {
      version: opensearch.EngineVersion.OPENSEARCH_2_5,
      capacity: {
        dataNodes: 1,
        dataNodeInstanceType: 't3.small.search',
      },
      ebs: {
        volumeSize: 10,
      },
    });

    // Lambda function for processing documents
    const processorFunction = new lambda.Function(this, 'ProcessorFunction', {
      runtime: lambda.Runtime.NODEJS_18_X,
      handler: 'index.handler',
      code: lambda.Code.fromAsset('lambda'),
      environment: {
        OPENSEARCH_DOMAIN: openSearchDomain.domainEndpoint,
      },
      timeout: cdk.Duration.minutes(5),
    });

    // Grant permissions
    documentBucket.grantRead(processorFunction);
    openSearchDomain.grantWrite(processorFunction);
  }
}

Et maintenant, la fonction Lambda qui effectue le découpage et l'indexation :

import { S3Event } from 'aws-lambda';
import { S3 } from 'aws-sdk';
import { Client } from '@opensearch-project/opensearch';
import { defaultProvider } from '@aws-sdk/credential-provider-node';
import { AwsSigv4Signer } from '@opensearch-project/opensearch/aws';

const s3 = new S3();
const CHUNK_SIZE = 1000;
const CHUNK_OVERLAP = 200;

// Create OpenSearch client
const client = new Client({
  ...AwsSigv4Signer({
    region: process.env.AWS_REGION,
    service: 'es',
    getCredentials: () => {
      const credentialsProvider = defaultProvider();
      return credentialsProvider();
    },
  }),
  node: `https://${process.env.OPENSEARCH_DOMAIN}`,
});

export const handler = async (event: S3Event) => {
  for (const record of event.Records) {
    const bucket = record.s3.bucket.name;
    const key = decodeURIComponent(record.s3.object.key.replace(/\ /g, ' '));

    // Get the document from S3
    const { Body } = await s3.getObject({ Bucket: bucket, Key: key }).promise();
    const text = Body.toString('utf-8');

    // Chunk the document
    const chunks = chunkText(text);

    // Index chunks in OpenSearch
    for (const [index, chunk] of chunks.entries()) {
      await client.index({
        index: 'knowledge-base',
        body: {
          content: chunk,
          documentKey: key,
          chunkIndex: index,
          timestamp: new Date().toISOString(),
        },
      });
    }
  }
};

function chunkText(text: string): string[] {
  const chunks: string[] = [];
  let start = 0;

  while (start 




  
  
  Comment tout cela fonctionne ensemble ?




Téléchargement de documents : lorsque vous téléchargez un document dans le compartiment S3, cela déclenche notre fonction Lambda.

Traitement : La fonction Lambda :


Récupère le document de S3
Le décompose à l'aide de notre algorithme de segmentation intelligent
Indexe chaque morceau dans OpenSearch avec des métadonnées



Récupération : plus tard, lorsque votre application a besoin de trouver des informations, elle peut interroger OpenSearch pour trouver les morceaux les plus pertinents.


Voici un exemple rapide de la façon dont vous pouvez interroger cette base de connaissances :



async function queryKnowledgeBase(query: string) {
  const response = await client.search({
    index: 'knowledge-base',
    body: {
      query: {
        multi_match: {
          query: query,
          fields: ['content'],
        },
      },
    },
  });

  return response.body.hits.hits.map(hit => ({
    content: hit._source.content,
    documentKey: hit._source.documentKey,
    score: hit._score,
  }));
}





  
  
  L'avantage AWS ?️


L'utilisation des services AWS comme S3, Lambda et OpenSearch nous donne :

Évolutivité sans serveur (pas de serveur à gérer !)
Tarif à l'utilisation (votre portefeuille vous remerciera)
Services gérés (moins de travail opérationnel = plus de plaisir de codage)

Pensées finales ?

Et voilà, les amis ! Un exemple concret de la façon d'implémenter le chunking dans une base de connaissances sans serveur. La meilleure partie ? Celui-ci évolue automatiquement et peut gérer des documents de n'importe quelle taille.

N'oubliez pas que la clé d'un bon chunking est :

Choisissez la taille de morceau adaptée à votre cas d'utilisation
Envisagez les chevauchements pour maintenir le contexte
Utilisez des limites naturelles lorsque cela est possible (comme des phrases ou des paragraphes)

Quelle est votre expérience en matière de création de bases de connaissances ? Avez-vous essayé différentes stratégies de segmentation ? Faites-le moi savoir dans les commentaires ci-dessous ! ?

Déclaration de sortie Cet article est reproduit à l'adresse : https://dev.to/aws-builders/chunking-in-ai-the-secret-sauce-youre-missing-5dfa?1 En cas de violation, veuillez contacter [email protected] pour le supprimer

Dernier tutoriel Plus>

Au-delà des instructions « if » : où d'autre un type avec une conversion « bool » explicite peut-il être utilisé sans conversion ?
Conversion contextuelle en bool autorisée sans transtypageVotre classe définit une conversion explicite en bool, vous permettant d'utiliser son in...

La programmation Publié le 06/01/2025
Comment combiner deux tableaux associatifs en PHP tout en préservant les identifiants uniques et en gérant les noms en double ?
Combiner des tableaux associatifs en PHPEn PHP, combiner deux tableaux associatifs en un seul tableau est une tâche courante. Considérez la requête su...

La programmation Publié le 06/01/2025
Qu'est-il arrivé à la compensation des colonnes dans Bootstrap 4 Beta ?
Bootstrap 4 Beta : suppression et restauration de la compensation de colonneBootstrap 4, dans sa version bêta 1, a introduit des changements important...

La programmation Publié le 06/01/2025
Pourquoi la requête POST ne capture-t-elle pas l'entrée en PHP malgré un code valide ?
Résolution d'un dysfonctionnement de la requête POST en PHPDans l'extrait de code présenté :action=''au lieu de :action="<?php echo $_...

La programmation Publié le 06/01/2025
Utilisation de WebSockets dans Go pour la communication en temps réel
Créer des applications qui nécessitent des mises à jour en temps réel, comme des applications de chat, des notifications en direct ou des outils colla...

La programmation Publié le 06/01/2025
Comment réparer « ImproperlyConfigured : erreur de chargement du module MySQLdb » dans Django sur macOS ?
MySQL mal configuré : le problème avec les chemins relatifsLors de l'exécution de python manage.py runserver dans Django, vous pouvez rencontrer l...

La programmation Publié le 06/01/2025
Comment réparer « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion de données ?
Comment résoudre « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion d'enregistrementsIntroduction :L'insertion de d...

La programmation Publié le 05/01/2025
Comment puis-je trouver des utilisateurs dont les anniversaires sont aujourd'hui à l'aide de MySQL ?
Comment identifier les utilisateurs dont l'anniversaire est le jour à l'aide de MySQLDéterminer si aujourd'hui est l'anniversaire d...

La programmation Publié le 05/01/2025
Comment supprimer des lignes avec des valeurs nulles d'une colonne Pandas DataFrame ?
Suppression des valeurs nulles d'une colonne Pandas DataFramePour supprimer des lignes d'un Pandas DataFrame en fonction de valeurs nulles dan...

La programmation Publié le 01/01/2025
Comment puis-je saisir correctement Assert une tranche de valeurs d’interface dans Go ?
Type affirmant une tranche de valeurs d'interfaceEn programmation, il est courant de rencontrer des situations où vous devez taper affirmer une tr...

La programmation Publié le 01/01/2025
Pourquoi `list.sort()` renvoie-t-il `None` et comment obtenir la liste triée ?
Comprendre la méthode Sort() et sa valeur de retourEn essayant de trier et de renvoyer une liste de mots uniques, vous pouvez rencontrer un problème c...

La programmation Publié le 01/01/2025
Comment créer une expression régulière « preg_match » insensible à la casse ?
Rendre preg_match insensible à la casseDans l'extrait de code fourni dans la question, le respect de la casse empêche l'obtention du résultat ...

La programmation Publié le 01/01/2025
Comment un DocumentFilter peut-il restreindre efficacement l'entrée JTextField aux entiers ?
Filtrage de l'entrée JTextField vers des entiers : une approche efficace avec DocumentFilterBien qu'intuitif, l'utilisation d'un écout...

La programmation Publié le 01/01/2025
Comment définir « ulimit -n » à partir d'un programme Go ?
Comment définir ulimit -n à partir d'un programme Golang ?La fonction syscall.Setrlimit de Go permet de définir ulimit -n à partir d'un progra...

La programmation Publié le 2024-12-31
Pourquoi Java imprime-t-il les tableaux de manière étrange et comment puis-je imprimer leur contenu correctement ?
Impression de tableaux étranges en JavaEn Java, les tableaux sont plus qu'une simple collection de valeurs. Ce sont des objets avec un comportemen...

La programmation Publié le 2024-12-31

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article