Implementar un caché LRU en Go

Página delantera > Programación > Implementar un caché LRU en Go

Implementar un caché LRU en Go

Publicado el 2024-08-06

Navegar:688

Implement an LRU Cache in Go

Por lo tanto, necesita un caché pequeño y no puede justificar una instancia de Redis o Memcached. Veamos qué se necesita para implementar uno en Go. Por diversión, lo haremos usando genéricos para que sea reutilizable en nuestro proyecto.

Un caché LRU generalmente tiene una capacidad fija y la política de expulsión más simple: expulsa el elemento que lleva más tiempo desde que se accedió. Un caché lru simple implementará la siguiente interfaz:

type LRUCache[T any] interface {
    Get(key string) (value T, found bool)
    Put(key string, value T)
    Keys() []string
    Remove(key string) bool
    Clear()
    Capacity() int
    Len() int
}

Sabemos que la caché almacenará un elemento de datos como una entrada codificada por algún valor. Eso suena como un mapa. ¿Qué pasa con la implementación de la política de expulsión? Una forma de hacerlo es mantener una propiedad timeAccessed junto con cada elemento. Algo como:

type cacheEntry[T any] struct {
  Data T
  LastAccessed time.time
}

Sin embargo, pensemos en el rendimiento, queremos poder buscar la clave de caché, así como insertar y desalojar la más antigua, si es necesario, lo más rápido posible.

El uso de un mapa, que es una tabla hash, nos brindará un rendimiento bastante rápido para las búsquedas. ¿Qué tal encontrar la entrada más antigua? Si su estructura de caché se ve así:

type LRUCache[T any] {
  capacity int
  keyMap map[string]cacheEntry[T]
}

Necesariamente necesitaremos iterar sobre el mapa para encontrar el más antiguo cuando llegue el momento de desalojar una entrada.

Necesitamos una forma de almacenar entradas de una manera que nos permita mantener ordenadas de manera eficiente una lista de entradas de caché. Es preferible que no necesitemos utilizar una rutina de clasificación.

Una lista de doble enlace es una buena manera de hacer esto y no necesitamos almacenar el tiempo de acceso en la entrada a menos que realmente lo queramos. Entonces supongamos que tenemos una lista vinculada que implementa lo siguiente junto con su estructura de nodo:

type DoubleLinkedList[T any] interface {
    Head() *DoubleNode[T]
    Tail() *DoubleNode[T]
    // Append inserts new item at tail
    Append(data T) *DoubleNode[T]
    // Push appends new item at head
    Push(data T) *DoubleNode[T]
    Remove(node *DoubleNode[T]) *DoubleNode[T]
    RemoveTail() *DoubleNode[T]
    MoveToHead(node *DoubleNode[T])
}
type DoubleNode[T any] struct {
    Data T
    Prev *DoubleNode[T]
    Next *DoubleNode[T]
}

La estructura de caché ahora puede verse así:

type lruCache[T any] struct {
    capacity int
    keyMap   map[string]*DoubleNode[lruCacheEntry[T]]
    list     DoubleLinkedList[lruCacheEntry[T]]
}

La estructura de entrada de caché será:

type lruCacheEntry[T any] struct {
    key   string
    value T
}

De manera realista, probablemente usarías una interfaz para la clave de caché. Estoy usando una cadena para mantener el código simple.

En la implementación aquí, la entrada de la memoria caché a la que se accedió más recientemente estará al principio y la utilizada menos recientemente estará al final. Entonces, cuando llega el momento de desalojar, simplemente eliminamos el elemento final de la lista vinculada.

Implementar la función Get() es simple:

func (l *lruCache[T]) Get(key string) (value T, found bool) {
    if node, ok := l.keyMap[key]; ok {
        l.list.MoveToHead(node)
        return node.Data.value, ok
    }
    var zero T
    return zero, false
}

Get solo necesita recuperar la entrada del mapa para la clave, luego mover el nodo al principio de la lista, ya que ahora es el "usado más recientemente".

La función Put() es donde manejaremos el desalojo si es necesario:

func (l *lruCache[T]) Put(key string, value T) {
    if node, ok := l.keyMap[key]; ok {
        node.Data = lruCacheEntry[T]{
            key:   key,
            value: value,
        }
        // move the element to the most recent position
        l.list.MoveToHead(node)
    } else {
        // insert the new element at the head
        newNode := l.list.Push(lruCacheEntry[T]{
            key:   key,
            value: value,
        })
        l.keyMap[key] = newNode
    }
    // is eviction necessary
    if len(l.keyMap) > l.capacity {
        nodeRemoved := l.list.RemoveTail()
        delete(l.keyMap, nodeRemoved.Data.key)
    }
}

Para Put(), primero verificamos si ya existe un valor para la clave dada. Si es así, actualice el valor y mueva el nodo al principio de la lista. De lo contrario, creamos una nueva entrada de caché, la agregamos a la lista como encabezado y la agregamos a nuestro mapa.

Finalmente, no olvides verificar la capacidad. Si la nueva entrada nos supera la capacidad, desalojamos la entrada más antigua que está al final de la lista y eliminamos la entrada de nuestro mapa.

Tenga en cuenta que almacenar la clave como parte de la entrada de caché nos permite eliminar rápidamente la clave del mapa. Si solo hubiéramos almacenado los datos en la entrada de la caché, entonces necesitaríamos recorrer el mapa para encontrarlos.

A este caché le falta algo crítico para una aplicación de subprocesos múltiples. No hay sincronización. De manera realista, varios subprocesos accederían a un caché. La sincronización es un tema complejo. Para nuestra implementación, podemos agregar un mutex a la estructura de caché:

type lruCache[T any] struct {
    capacity int
    keyMap   map[string]DoubleNode[lruCacheEntry[T]]
    list     DoubleLinkedList[lruCacheEntry[T]]
    mutex    sync.RWMutex
}

luego agregue lo siguiente al inicio de cada función.

    l.mutex.Lock()
    defer l.mutex.Unlock()

Observe que estamos usando un bloqueo de lectura/escritura. Algunas de las funciones no cambian la estructura del caché, por lo que podemos usar el método de bloqueo de lectura proporcionado, por ejemplo la función Len():

func (l *lruCache[T]) Len() int {
    l.mutex.RLock()
    defer l.mutex.RUnlock()
    return len(l.keyMap)
}

Tenga en cuenta que la estrategia de sincronización elegida aquí puede fallar si hay una gran cantidad de subprocesos intentando acceder al caché. Es un tema complejo que podría abarcar una serie de publicaciones en sí mismo.

Vea la implementación completa en el repositorio que figura en el siguiente enlace.

¿Qué harías diferente para implementar un caché? ¿Cómo abordarías la sincronización? Estoy interesado en escuchar tu opinión sobre este. No existe una única solución para esto, así que deja tus comentarios a continuación.

¡Gracias!

El código de esta publicación y todas las publicaciones de esta serie se pueden encontrar aquí

Declaración de liberación Este artículo se reproduce en: https://dev.to/johnscode/implement-an-lru-cache-in-go-1hbc?1 Si hay alguna infracción, comuníquese con [email protected] para eliminarla.

Último tutorial Más>

¿Cómo lidiar con la memoria en rodajas en la recolección de basura del idioma GO?
colección de basura en cortes de Go: un análisis detallado en Go, una porción es una matriz dinámica que hace referencia a una matriz subyacen...

Programación Publicado el 2025-07-04
¿Cómo implementar una función hash genérica para tuplas en colecciones desordenadas?
Función hash genérica para tuplas en colecciones no ordenadas los contenedores std :: unordened_map y std :: unordened_set proporcionan una mi...

Programación Publicado el 2025-07-04
¿Cómo recuperar eficientemente la última fila para cada identificador único en PostgreSQL?
postgresql: extrayendo la última fila para cada identificador único en postgresql, puede encontrar situaciones en las que necesita extraer la ...

Programación Publicado el 2025-07-04
¿Cómo insertar o actualizar eficientemente filas basadas en dos condiciones en MySQL?
solución: La respuesta se encuentra en la sintaxis de la actualización de clave duplicada de MySQL. Esta potente característica permite una mani...

Programación Publicado el 2025-07-04
¿Cómo crear variables dinámicas en Python?
Dynamic Variable Creation en python La capacidad de crear variables dinámicamente puede ser una herramienta poderosa, especialmente cuando se ...

Programación Publicado el 2025-07-04
Método de JavaScript para calcular el número de días entre dos fechas
cómo calcular la diferencia entre las fechas en javascript como intenta determinar la diferencia entre dos fechas en JavaScript, considere est...

Programación Publicado el 2025-07-04
¿Cómo repetir eficientemente los caracteres de cadena para la sangría en C#?
repitiendo una cadena para la indentación al sangrar una cadena basada en la profundidad de un elemento, es conveniente tener una forma eficie...

Programación Publicado el 2025-07-04
El error del compilador "usr/bin/ld: no se puede encontrar -l" solución
Error encontrado: "usr/bin/ld: no puedo encontrar -l " -l usr/bin/ld: cannot find -l<nameOfTheLibrary> agregando rutas de ...

Programación Publicado el 2025-07-04
¿Cómo selecciono de manera eficiente columnas en Pandas Dataframes?
seleccionando columnas en Pandas Dataframes cuando se trata de tareas de manipulación de datos, se hace necesario seleccionar columnas específ...

Programación Publicado el 2025-07-04
Fit de objeto: la cubierta falla en IE y Edge, ¿cómo solucionar?
Object-Fit: la portada falla en IE y Edge, ¿cómo solucionar? utilizando objeto-fit: cover; en CSS para mantener la altura de imagen consistent...

Programación Publicado el 2025-07-04
¿Estará realmente el despertar falso en Java?
Los despertar espurios en java: realidad o mito? El concepto de despertar espurios en la sincronización de Java ha sido un tema de discusión dur...

Programación Publicado el 2025-07-04
¿Por qué no `cuerpo {margen: 0; } `¿Siempre elimina el margen superior en CSS?
abordando la eliminación del margen del cuerpo en css para desarrolladores web novatos, eliminar el margen del elemento corporal puede ser una...

Programación Publicado el 2025-07-04
¿Cómo mostrar correctamente la fecha y hora actuales en el formato "DD/MM/YYYY HH: MM: SS.SS" en Java?
cómo mostrar la fecha y la hora actuales en "dd/mm/aa radica en el uso de diferentes instancias de SimpleFormat con diferentes patrones de f...

Programación Publicado el 2025-07-04
¿Cómo capturar y transmitir stdout en tiempo real para la ejecución del comando de chatbot?
capturando stdout en tiempo real desde la ejecución de comandos en el reino de desarrollar chatbots capaces de ejecutar comandos, un requisito...

Programación Publicado el 2025-07-04
$¿Cómo corregir \ "mysql_config no encontrado \" error al instalar mysql-python en Ubuntu/Linux?$
¿Cómo corregir \ "mysql_config no encontrado \" error al instalar mysql-python en Ubuntu/Linux?
mysql-python Error de instalación: "mysql_config no encontrado" intentando instalar mysql-python en ubuntu/linux box puede encontrar...

Programación Publicado el 2025-07-04

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo