Executando o Llama no Android: um guia passo a passo usando o Ollama

Primeira página > Programação > Executando o Llama no Android: um guia passo a passo usando o Ollama

Executando o Llama no Android: um guia passo a passo usando o Ollama

Publicado em 2024-11-09

Navegar:813

Running Llama on Android: A Step-by-Step Guide Using Ollama

Llama 3.2 foi apresentado recentemente na Meta’s Developer Conference, apresentando recursos multimodais impressionantes e uma versão otimizada para dispositivos móveis usando hardware Qualcomm e MediaTek. Essa inovação permite que os desenvolvedores executem modelos de IA poderosos, como o Llama 3.2, em dispositivos móveis, abrindo caminho para aplicativos de IA mais eficientes, privados e responsivos.

Meta lançou quatro variantes do Llama 3.2:

Modelos multimodais com 11 bilhões (11B) e 90 bilhões (90B) de parâmetros.
Modelos somente texto com 1 bilhão (1B) e 3 bilhões (3B) de parâmetros.

Os modelos maiores, especialmente as variantes 11B e 90B, se destacam em tarefas como compreensão de imagens e raciocínio de gráficos, muitas vezes superando outros modelos como Claude 3 Haiku e até mesmo competindo com GPT-4o-mini em certos casos. Por outro lado, os modelos leves 1B e 3B são projetados para geração de texto e recursos multilíngues, tornando-os ideais para aplicações no dispositivo onde a privacidade e a eficiência são fundamentais.

Neste guia, mostraremos como executar o Llama 3.2 em um dispositivo Android usando Termux e Ollama. Termux fornece um ambiente Linux no Android e Ollama ajuda no gerenciamento e execução de grandes modelos localmente.

Por que executar o Llama 3.2 localmente?

Executar modelos de IA localmente oferece dois benefícios principais:

Processamento instantâneo já que tudo é tratado no dispositivo.
Privacidade aprimorada, pois não há necessidade de enviar dados para a nuvem para processamento.

Embora ainda não existam muitos produtos que permitam que dispositivos móveis executem modelos como o Llama 3.2 sem problemas, ainda podemos explorá-lo usando um ambiente Linux no Android.

Etapas para executar o Llama 3.2 no Android

1. Instale o Termux no Android

Termux é um emulador de terminal que permite que dispositivos Android executem um ambiente Linux sem precisar de acesso root. Ele está disponível gratuitamente e pode ser baixado na página Termux GitHub.

Para este guia, baixe o termux-app_v0.119.0-beta.1 apt-android-7-github-debug_arm64-v8a.apk e instale-o em seu dispositivo Android.

2. Configure o Termux

Após iniciar o Termux, siga estas etapas para configurar o ambiente:

Conceder acesso ao armazenamento:

   termux-setup-storage

Este comando permite que o Termux acesse o armazenamento do seu dispositivo Android, facilitando o gerenciamento de arquivos.

Pacotes de atualização:

   pkg upgrade

Digite Y quando solicitado a atualizar o Termux e todos os pacotes instalados.

Instale ferramentas essenciais:

   pkg install git cmake golang

Esses pacotes incluem Git para controle de versão, CMake para construção de software e Go, a linguagem de programação na qual Ollama foi escrito.

3. Instale e compile o Ollama

Ollama é uma plataforma para executar grandes modelos localmente. Veja como instalar e configurar:

Clone o repositório GitHub do Ollama:

   git clone --depth 1 https://github.com/ollama/ollama.git

Navegue até o diretório Ollama:

   cd ollama

Gerar código Go:

   go generate ./...

Construir Ollama:

   go build .

Iniciar servidor Ollama:

   ./ollama serve &

Agora o servidor Ollama será executado em segundo plano, permitindo que você interaja com os modelos.

4. Executando modelos Llama 3.2

Para executar o modelo Llama 3.2 em seu dispositivo Android, siga estas etapas:

Escolha um modelo:
- Modelos como llama3.2:3b (3 bilhões de parâmetros) estão disponíveis para teste. Esses modelos são quantizados para eficiência. Você pode encontrar uma lista de modelos disponíveis no site da Ollama.
Baixe e execute o modelo Llama 3.2:

   ./ollama run llama3.2:3b --verbose

O sinalizador --verbose é opcional e fornece logs detalhados. Após a conclusão do download, você pode começar a interagir com o modelo.

5. Gerenciando Desempenho

Ao testar o Llama 3.2 em dispositivos como o Samsung S21 Ultra, o desempenho foi bom para o modelo 1B e gerenciável para o modelo 3B, embora você possa notar atraso em hardware mais antigo. Se o desempenho for muito lento, mudar para o modelo 1B menor pode melhorar significativamente a capacidade de resposta.

Limpeza Opcional

Depois de usar o Ollama, você pode querer limpar o sistema:

Remover arquivos desnecessários:

   chmod -R 700 ~/go
   rm -r ~/go

Mova o binário Ollama para um caminho global:

   cp ollama/ollama /data/data/com.termux/files/usr/bin/

Agora, você pode executar ollama diretamente do terminal.

Conclusão

Llama 3.2 representa um grande avanço na tecnologia de IA, trazendo modelos multimodais poderosos para dispositivos móveis. Ao executar esses modelos localmente usando Termux e Ollama, os desenvolvedores podem explorar o potencial de aplicativos de IA no dispositivo que priorizam a privacidade e que não dependem de infraestrutura em nuvem. Com modelos como o Llama 3.2, o futuro da IA móvel parece brilhante, permitindo soluções de IA mais rápidas e seguras em vários setores.

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/koolkamalkishor/running-llama-32-on-android-a-step-by-step-guide-using-ollama-54ig?1 Se houver alguma violação, por favor entre em contato com study_golang@163 .comdelete

Tutorial mais recente Mais>

Como posso gerar com eficiência as lesmas amigáveis ao URL a partir de strings unicode no PHP?
criando uma função para geração de lesmas eficientes criando lesmas, representações simplificadas de strings unicode usadas nos URLs, podem se...

Programação Postado em 2025-04-16
Como posso unindo tabelas de banco de dados com diferentes números de colunas?
tabelas combinadas com diferentes colunas ] pode encontrar desafios ao tentar mesclar tabelas de banco de dados com colunas diferentes. Uma man...

Programação Postado em 2025-04-16
3 maneiras de se conectar, você deve saber
Key Takeaways The article explains the use of LEFT JOIN, RIGHT JOIN, INNER JOIN, and OUTER JOIN in SQL, using a simple example of a book loan databas...

Programação Postado em 2025-04-16
$\ "while (1) vs. para (;;): a otimização do compilador elimina as diferenças de desempenho? \"$
\ "while (1) vs. para (;;): a otimização do compilador elimina as diferenças de desempenho? \"
while (1) vs. for (;;): existe uma diferença de velocidade? loops? Resposta: Na maioria dos compiladores modernos, não há diferença de dese...

Programação Postado em 2025-04-16
Como verificar se um objeto tem um atributo específico no Python?
Método para determinar o atributo de objeto Existence Esta consulta busca um método para verificar a presença de um atributo específico em um ...

Programação Postado em 2025-04-16
Variedade
Os métodos são FNs que podem ser chamados em objetos Matrizes são objetos, portanto, eles também têm métodos no JS. Flice (Begin): Extra...

Programação Postado em 2025-04-16
Como acessar dinamicamente variáveis globais em JavaScript?
acessando variáveis globais dinamicamente pelo nome em javascript obtendo acesso a variáveis globais durante o tempo de execução pode ser um...

Programação Postado em 2025-04-16
Como posso iterar de maneira síncrona e imprimir valores de duas matrizes de tamanho igual no PHP?
iterando e imprimindo valores de duas matrizes do mesmo tamanho ao criar uma caixa selecionada usando duas matrizes de tamanho igual, um contend...

Programação Postado em 2025-04-16
Subvert AI e 48V Power Supply, o novo produto da Innosecco lançou chocantemente
isso faz o seu olho um pouco? Como ... é um erro de digitação. Deve ser Target = "_ Blank" com um sublinhado para iniciar o valor. Como em…...

Programação Postado em 2025-04-16
Como posso configurar o PyTesSeract para reconhecimento de um dígito com a saída apenas para número?
pyTesseract OCR com reconhecimento de um dígito e restrições somente para números no contexto do pyTesSeract, a configuração do TESSERACT para...

Programação Postado em 2025-04-16
Objetos-ajuste: a capa falha no IE e na borda, como consertar?
object-fit: a capa falha no ie e borda, como corrigir? utilizando objeto-fit: cover; No CSS, para manter a altura consistente da imagem funcio...

Programação Postado em 2025-04-16
Implementação dinâmica reflexiva da interface GO para exploração de método RPC
reflexão para a implementação da interface dinâmica em go A reflexão em Go é uma ferramenta poderosa que permite a inspeção e manipulação do c...

Programação Postado em 2025-04-16
$Por que estou recebendo um erro "Class \ 'Ziparchive \' não encontrado \" depois de instalar o Archive_zip no meu servidor Linux?$
Por que estou recebendo um erro "Class \ 'Ziparchive \' não encontrado \" depois de instalar o Archive_zip no meu servidor Linux?
classe 'ziparchive' não encontrou erro ao instalar Archive_zip no servidor Linux sintoma: quando o script de script que utiliza o zi...

Programação Postado em 2025-04-16
Guia de criação de páginas de 404 de 404 da FASTAPI
Página 404 personalizada não encontrada com fastapi para criar uma página 404 personalizada não encontrada, o FASTAPI oferece várias abordagen...

Programação Postado em 2025-04-16
Por que não é um pedido de solicitação de captura de entrada no PHP, apesar do código válido?
abordando o mau funcionamento da solicitação de postagem em php no snippet de código apresentado: action='' Mantenha -se vigilante com a alo...

Programação Postado em 2025-04-16

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo