Разделение искусственного интеллекта: секретный соус, которого вам не хватает

титульная страница > программирование > Разделение искусственного интеллекта: секретный соус, которого вам не хватает

Разделение искусственного интеллекта: секретный соус, которого вам не хватает

Опубликовано 8 ноября 2024 г.

Просматривать:147

Chunking in AI - The Secret Sauce You

Привет, ребята! ?

Знаешь, что не дает мне уснуть по ночам? Думаем о том, как сделать наши системы искусственного интеллекта умнее и эффективнее. Сегодня я хочу поговорить о чем-то, что может показаться простым, но имеет решающее значение при создании потрясающих приложений искусственного интеллекта: разбиение на части ✨.

Что вообще за куски? ?

Думайте о фрагментировании как о способе вашего ИИ разбить огромный массив информации на управляемые небольшие порции. Точно так же, как вы не стали бы пытаться запихнуть в рот целую пиццу сразу (или, возможно, вы бы это сделали, здесь нечего судить!), вашему ИИ необходимо разбивать большие тексты на более мелкие части, чтобы эффективно их обрабатывать.

Это особенно важно для того, что мы называем моделями RAG (Извлечение-дополненная генерация). Эти плохие парни не просто выдумывают всякую всячину — они на самом деле идут и получают реальную информацию из внешних источников. Довольно аккуратно, правда?

Почему вас это должно волновать? ?

Послушайте, если вы создаете что-то, что связано с текстом — будь то чат-бот службы поддержки клиентов или необычный поиск в базе знаний — правильное разбиение на фрагменты — это разница между ИИ, который дает точные ответы, и тем, который просто… ага.

Слишком большие куски? Ваша модель не соответствует сути.
Слишком маленькие кусочки? Он теряется в деталях.

Давайте запачкаем руки: реальные примеры?

Пример Python: семантическое разделение

Во-первых, давайте посмотрим на пример Python, использующий LangChain для семантического фрагментирования:

from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import TextLoader

def semantic_chunk(file_path):
    # Load the document
    loader = TextLoader(file_path)
    document = loader.load()

    # Create a text splitter
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=200,
        length_function=len,
        separators=["\n\n", "\n", " ", ""]
    )

    # Split the document into chunks
    chunks = text_splitter.split_documents(document)

    return chunks

# Example usage
chunks = semantic_chunk('knowledge_base.txt')
for i, chunk in enumerate(chunks):
    print(f"Chunk {i}: {chunk.page_content[:50]}...")

Пример Node.js и CDK: создание базы знаний

Теперь давайте создадим что-то настоящее — бессерверную базу знаний с использованием AWS CDK и Node.js! ?

Во-первых, инфраструктура CDK (здесь и происходит волшебство):

import * as cdk from 'aws-cdk-lib';
import * as s3 from 'aws-cdk-lib/aws-s3';
import * as lambda from 'aws-cdk-lib/aws-lambda';
import * as opensearch from 'aws-cdk-lib/aws-opensearch';
import * as iam from 'aws-cdk-lib/aws-iam';

export class KnowledgeBaseStack extends cdk.Stack {
  constructor(scope: cdk.App, id: string, props?: cdk.StackProps) {
    super(scope, id, props);

    // S3 bucket to store our documents
    const documentBucket = new s3.Bucket(this, 'DocumentBucket', {
      removalPolicy: cdk.RemovalPolicy.DESTROY,
    });

    // OpenSearch domain for storing our chunks
    const openSearchDomain = new opensearch.Domain(this, 'DocumentSearch', {
      version: opensearch.EngineVersion.OPENSEARCH_2_5,
      capacity: {
        dataNodes: 1,
        dataNodeInstanceType: 't3.small.search',
      },
      ebs: {
        volumeSize: 10,
      },
    });

    // Lambda function for processing documents
    const processorFunction = new lambda.Function(this, 'ProcessorFunction', {
      runtime: lambda.Runtime.NODEJS_18_X,
      handler: 'index.handler',
      code: lambda.Code.fromAsset('lambda'),
      environment: {
        OPENSEARCH_DOMAIN: openSearchDomain.domainEndpoint,
      },
      timeout: cdk.Duration.minutes(5),
    });

    // Grant permissions
    documentBucket.grantRead(processorFunction);
    openSearchDomain.grantWrite(processorFunction);
  }
}

А теперь функция Lambda, которая выполняет разбиение на фрагменты и индексацию:

import { S3Event } from 'aws-lambda';
import { S3 } from 'aws-sdk';
import { Client } from '@opensearch-project/opensearch';
import { defaultProvider } from '@aws-sdk/credential-provider-node';
import { AwsSigv4Signer } from '@opensearch-project/opensearch/aws';

const s3 = new S3();
const CHUNK_SIZE = 1000;
const CHUNK_OVERLAP = 200;

// Create OpenSearch client
const client = new Client({
  ...AwsSigv4Signer({
    region: process.env.AWS_REGION,
    service: 'es',
    getCredentials: () => {
      const credentialsProvider = defaultProvider();
      return credentialsProvider();
    },
  }),
  node: `https://${process.env.OPENSEARCH_DOMAIN}`,
});

export const handler = async (event: S3Event) => {
  for (const record of event.Records) {
    const bucket = record.s3.bucket.name;
    const key = decodeURIComponent(record.s3.object.key.replace(/\ /g, ' '));

    // Get the document from S3
    const { Body } = await s3.getObject({ Bucket: bucket, Key: key }).promise();
    const text = Body.toString('utf-8');

    // Chunk the document
    const chunks = chunkText(text);

    // Index chunks in OpenSearch
    for (const [index, chunk] of chunks.entries()) {
      await client.index({
        index: 'knowledge-base',
        body: {
          content: chunk,
          documentKey: key,
          chunkIndex: index,
          timestamp: new Date().toISOString(),
        },
      });
    }
  }
};

function chunkText(text: string): string[] {
  const chunks: string[] = [];
  let start = 0;

  while (start 




  
  
  Как все это работает вместе?




Загрузка документа: когда вы загружаете документ в корзину S3, активируется наша функция Lambda.

Обработка: Лямбда-функция:


Извлекает документ из S3
Разбивает на части, используя наш интеллектуальный алгоритм разделения на части
Индексирует каждый фрагмент в OpenSearch с метаданными



Извлечение: позже, когда вашему приложению потребуется найти информацию, оно может запросить OpenSearch, чтобы найти наиболее релевантные фрагменты.


Вот краткий пример того, как можно запросить эту базу знаний:



async function queryKnowledgeBase(query: string) {
  const response = await client.search({
    index: 'knowledge-base',
    body: {
      query: {
        multi_match: {
          query: query,
          fields: ['content'],
        },
      },
    },
  });

  return response.body.hits.hits.map(hit => ({
    content: hit._source.content,
    documentKey: hit._source.documentKey,
    score: hit._score,
  }));
}





  
  
  Преимущество AWS ?️


Использование сервисов AWS, таких как S3, Lambda и OpenSearch, дает нам:

Бессерверная масштабируемость (нет серверов для управления!)
Цена с оплатой по факту использования (ваш кошелек скажет вам спасибо)
Управляемые услуги (меньше операций = больше удовольствия от кодирования)

Заключительные мысли?

Вот и все, ребята! Реальный пример реализации фрагментации в бессерверной базе знаний. Лучшая часть? Он автоматически масштабируется и может обрабатывать документы любого размера.

Помните, что ключ к хорошему фрагментированию — это:

Выберите размер чанка, подходящий для вашего случая использования
Учитывайте дублирование, чтобы сохранить контекст
По возможности используйте естественные границы (например, предложения или абзацы)

Каков ваш опыт создания баз знаний? Пробовали ли вы разные стратегии разбиения на блоки? Дайте мне знать в комментариях ниже! ?

Заявление о выпуске Эта статья воспроизведена по адресу: https://dev.to/aws-builders/chunking-in-ai-the-secret-sauce-youre-missing-5dfa?1. В случае нарушения прав обращайтесь по адресу [email protected]. удалить его

Последний учебник Более>

Как исправить «Неправильно сконфигурировано: ошибка загрузки модуля MySQLdb» в Django на macOS?
Неправильная настройка MySQL: проблема с относительными путямиПри запуске сервера запуска Python Manage.py в Django вы можете столкнуться со следующей...

программирование Опубликовано 4 января 2025 г.
Использование WebSockets в Go для общения в реальном времени
Создание приложений, требующих обновлений в режиме реального времени, таких как приложения чата, живые уведомления или инструменты для совместной рабо...

программирование Опубликовано 4 января 2025 г.
Помимо операторов if: где еще можно использовать тип с явным преобразованием bool без приведения?
Контекстное преобразование в bool разрешено без приведения Ваш класс определяет явное преобразование в bool, что позволяет использовать его экземпляр ...

программирование Опубликовано 4 января 2025 г.
Множество
Методы — это fns, которые можно вызывать на объектах Массивы — это объекты, поэтому в JS у них тоже есть методы. срез (начало): извлечь часть ...

программирование Опубликовано 4 января 2025 г.
Как я могу найти пользователей, у которых сегодня дни рождения, используя MySQL?
Как определить пользователей с сегодняшним днем рождения с помощью MySQLОпределение того, является ли сегодня день рождения пользователя с помощью M...

программирование Опубликовано 4 января 2025 г.
Что случилось со смещением столбцов в бета-версии Bootstrap 4?
Bootstrap 4 Beta: удаление и восстановление смещения столбцовBootstrap 4 в своей бета-версии 1 внес существенные изменения в способ столбцы были смеще...

программирование Опубликовано 4 января 2025 г.
Как объединить два ассоциативных массива в PHP, сохранив при этом уникальные идентификаторы и обработав повторяющиеся имена?
Объединение ассоциативных массивов в PHPВ PHP объединение двух ассоциативных массивов в один — распространенная задача. Рассмотрим следующий запрос:Оп...

программирование Опубликовано 4 января 2025 г.
Как удалить строки с нулевыми значениями из столбца DataFrame Pandas?
Удаление нулевых значений из столбца DataFrame PandasЧтобы удалить строки из DataFrame Pandas на основе нулевых значений в определенном столбце, выпол...

программирование Опубликовано 1 января 2025 г.
Как я могу правильно ввести Assert фрагмента значений интерфейса в Go?
Тип, утверждающий фрагмент значений интерфейсаВ программировании часто встречаются ситуации, когда вам нужно ввести утверждение фрагмента значений инт...

программирование Опубликовано 1 января 2025 г.
Почему `list.sort()` возвращает `None` и как мне получить отсортированный список?
Понимание метода Sort() и его возвращаемого значенияПри попытке отсортировать и вернуть список уникальных слов вы можете столкнуться с распространенна...

программирование Опубликовано 1 января 2025 г.
Как сделать регулярное выражение preg_match нечувствительным к регистру?
Сделать preg_match нечувствительным к региструВ фрагменте кода, приведенном в вопросе, чувствительность к регистру препятствует достижению желаемого р...

программирование Опубликовано 1 января 2025 г.
Как DocumentFilter может эффективно ограничить ввод JTextField целыми числами?
Фильтрация входных данных JTextField в целые числа: эффективный подход с DocumentFilterХотя использование прослушивателя ключей для проверки числового...

программирование Опубликовано 1 января 2025 г.
Как установить `ulimit -n` из программы Go?
Как установить ulimit -n из программы golang?Функция syscall.Setrlimit Go позволяет установить ulimit -n из программы Go. Это позволяет настраивать ог...

программирование Опубликовано 31 декабря 2024 г.
Почему Java странно печатает массивы и как правильно распечатать их содержимое?
Странная печать массивов в JavaВ Java массивы — это больше, чем просто набор значений. Это объекты с определенным поведением и представлением. Когда в...

программирование Опубликовано 31 декабря 2024 г.
Управление сессиями в PHP с помощью Lithe: от базовой настройки до расширенного использования
Когда мы говорим о веб-приложениях, одной из первых задач является сохранение информации о пользователях во время навигации по страницам. Именно здесь...

программирование Опубликовано 31 декабря 2024 г.