Llama auf Android ausführen: Eine Schritt-für-Schritt-Anleitung zur Verwendung von Ollama

Titelseite > Programmierung > Llama auf Android ausführen: Eine Schritt-für-Schritt-Anleitung zur Verwendung von Ollama

Llama auf Android ausführen: Eine Schritt-für-Schritt-Anleitung zur Verwendung von Ollama

Veröffentlicht am 09.11.2024

Durchsuche:268

Running Llama on Android: A Step-by-Step Guide Using Ollama

Llama 3.2 wurde kürzlich auf der Entwicklerkonferenz von Meta vorgestellt und präsentiert beeindruckende multimodale Fähigkeiten und eine für mobile Geräte mit Qualcomm- und MediaTek-Hardware optimierte Version. Dieser Durchbruch ermöglicht es Entwicklern, leistungsstarke KI-Modelle wie Llama 3.2 auf Mobilgeräten auszuführen und ebnet so den Weg für effizientere, privatere und reaktionsfähigere KI-Anwendungen.

Meta hat vier Varianten von Llama 3.2 veröffentlicht:

Multimodale Modelle mit 11 Milliarden (11B) und 90 Milliarden (90B) Parametern.
Nur-Text-Modelle mit 1 Milliarde (1B) und 3 Milliarden (3B) Parametern.

Die größeren Modelle, insbesondere die 11B- und 90B-Varianten, zeichnen sich durch Aufgaben wie Bildverständnis und Diagrammbegründung aus, übertreffen oft andere Modelle wie Claude 3 Haiku und konkurrieren in bestimmten Fällen sogar mit GPT-4o-mini. Andererseits sind die leichten 1B- und 3B-Modelle für die Textgenerierung und Mehrsprachigkeit konzipiert und eignen sich daher ideal für Anwendungen auf dem Gerät, bei denen Datenschutz und Effizienz im Vordergrund stehen.

In dieser Anleitung zeigen wir Ihnen, wie Sie Llama 3.2 auf einem Android-Gerät mit Termux und Ollama ausführen. Termux bietet eine Linux-Umgebung auf Android und Ollama hilft bei der lokalen Verwaltung und Ausführung großer Modelle.

Warum Llama 3.2 lokal ausführen?

Das lokale Ausführen von KI-Modellen bietet zwei große Vorteile:

Sofortige Verarbeitung da alles auf dem Gerät abgewickelt wird.
Verbesserter Datenschutz da keine Notwendigkeit besteht, Daten zur Verarbeitung an die Cloud zu senden.

Auch wenn es noch nicht viele Produkte gibt, mit denen mobile Geräte Modelle wie Llama 3.2 reibungslos ausführen können, können wir es dennoch mit einer Linux-Umgebung auf Android erkunden.

Schritte zum Ausführen von Llama 3.2 auf Android

1. Installieren Sie Termux auf Android

Termux ist ein Terminalemulator, der es Android-Geräten ermöglicht, eine Linux-Umgebung auszuführen, ohne Root-Zugriff zu benötigen. Es ist kostenlos verfügbar und kann von der Termux-GitHub-Seite heruntergeladen werden.

Laden Sie für dieses Handbuch die Datei termux-app_v0.119.0-beta.1 apt-android-7-github-debug_arm64-v8a.apk herunter und installieren Sie sie auf Ihrem Android-Gerät.

2. Richten Sie Termux ein

Nach dem Start von Termux befolgen Sie diese Schritte, um die Umgebung einzurichten:

Speicherzugriff gewähren:

   termux-setup-storage

Mit diesem Befehl kann Termux auf den Speicher Ihres Android-Geräts zugreifen und so die Dateiverwaltung vereinfachen.

Pakete aktualisieren:

   pkg upgrade

Geben Sie Y ein, wenn Sie aufgefordert werden, Termux und alle installierten Pakete zu aktualisieren.

Grundlegende Tools installieren:

   pkg install git cmake golang

Diese Pakete umfassen Git zur Versionskontrolle, CMake zum Erstellen von Software und Go, die Programmiersprache, in der Ollama geschrieben ist.

3. Installieren und kompilieren Sie Ollama

Ollama ist eine Plattform zum lokalen Ausführen großer Modelle. So installieren und richten Sie es ein:

Ollamas GitHub-Repository klonen:

   git clone --depth 1 https://github.com/ollama/ollama.git

Navigieren Sie zum Ollama-Verzeichnis:

   cd ollama

Go-Code generieren:

   go generate ./...

Ollama bauen:

   go build .

Ollama-Server starten:

   ./ollama serve &

Jetzt läuft der Ollama-Server im Hintergrund, sodass Sie mit den Modellen interagieren können.

4. Ausführen von Llama 3.2-Modellen

Um das Llama 3.2-Modell auf Ihrem Android-Gerät auszuführen, befolgen Sie diese Schritte:

Wählen Sie ein Modell:
- Modelle wie llama3.2:3b (3 Milliarden Parameter) stehen zum Testen zur Verfügung. Diese Modelle werden aus Effizienzgründen quantisiert. Eine Liste der verfügbaren Modelle finden Sie auf der Website von Ollama.
Laden Sie das Llama 3.2-Modell herunter und führen Sie es aus:

   ./ollama run llama3.2:3b --verbose

Das Flag --verbose ist optional und stellt detaillierte Protokolle bereit. Nachdem der Download abgeschlossen ist, können Sie mit der Interaktion mit dem Modell beginnen.

5. Leistungsmanagement

Beim Testen von Llama 3.2 auf Geräten wie dem Samsung S21 Ultra war die Leistung beim 1B-Modell reibungslos und beim 3B-Modell beherrschbar, obwohl Sie bei älterer Hardware möglicherweise eine Verzögerung bemerken. Wenn die Leistung zu langsam ist, kann der Wechsel zum kleineren 1B-Modell die Reaktionsfähigkeit deutlich verbessern.

Optionale Bereinigung

Nach der Verwendung von Ollama möchten Sie möglicherweise das System bereinigen:

Unnötige Dateien entfernen:

   chmod -R 700 ~/go
   rm -r ~/go

Ollama-Binärdatei auf einen globalen Pfad verschieben:

   cp ollama/ollama /data/data/com.termux/files/usr/bin/

Jetzt können Sie ollama direkt vom Terminal aus ausführen.

Abschluss

Llama 3.2 stellt einen großen Fortschritt in der KI-Technologie dar und bringt leistungsstarke, multimodale Modelle auf mobile Geräte. Durch die lokale Ausführung dieser Modelle mit Termux und Ollama können Entwickler das Potenzial datenschutzorientierter KI-Anwendungen auf dem Gerät erkunden, die nicht auf eine Cloud-Infrastruktur angewiesen sind. Mit Modellen wie Llama 3.2 sieht die Zukunft der mobilen KI rosig aus und ermöglicht schnellere und sicherere KI-Lösungen in verschiedenen Branchen.

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://dev.to/koolkamalkishor/running-llama-32-on-android-a-step-by-step-guide-using-ollama-54ig?1 Wenn es einen Verstoß gibt, bitte Kontaktieren Sie Study_golang@163 .comdelete

Neuestes Tutorial Mehr>

Designmuster in Java mit Beispielen
Was sind Designmuster in Java? Entwurfsmuster sind wiederverwendbare Lösungen für häufige Probleme beim Softwaredesign. Sie stellen Best Prac...

Programmierung Veröffentlicht am 09.11.2024
NestJS vs. Encore.ts: Auswahl des richtigen Frameworks für Ihre TypeScript-Microservices
Introduction When web applications grow larger, so does the complexity in developing and maintaining the system. A common way to solve this i...

Programmierung Veröffentlicht am 09.11.2024
Wie setze ich ein Generatorobjekt in Python zurück?
Ein Generatorobjekt in Python zurücksetzen: Alternativen erkundenGeneratoren bieten eine effiziente Möglichkeit, eine Folge von Werten zu durchlaufen,...

Programmierung Veröffentlicht am 09.11.2024
Wie kann ich die zuletzt eingefügte Zeile in MySQL effizient abrufen?
Abrufen der zuletzt eingefügten Zeile in MySQL: Effiziente AnsätzeDas effiziente Abrufen der zuletzt eingefügten Zeile in MySQL kann eine häufige Aufg...

Programmierung Veröffentlicht am 09.11.2024
Wie können die Kosten für deaktivierte Trace-Protokollierungsanweisungen in Go minimiert werden?
Kostengünstige Ablaufverfolgungsprotokollierung in Go für deaktivierte AnweisungenIn Go stellt die Ablaufverfolgungsprotokollierung eine einzigartige ...

Programmierung Veröffentlicht am 09.11.2024
Wie kombiniere ich in JavaScript mehrere Arrays zu einem?
Array-Elemente zu einem einzigen Array verkettenIn JavaScript kann das Kombinieren der Elemente mehrerer Arrays zu einem neuen Array eine häufige Notw...

Programmierung Veröffentlicht am 09.11.2024
SCHLEIFEN IN JAVASCRIPT MEINEN: EIN UMFASSENDER LEITFADEN
Schleifen sind in der Programmierung von grundlegender Bedeutung: Sie ermöglichen es uns, eine sich wiederholende Aufgabe mit minimalem Code auszuführ...

Programmierung Veröffentlicht am 09.11.2024
Wie kann ich die Dateigröße von Dateien über 2 GB in PHP ermitteln, ohne externe Programme zu verwenden?
Bestimmen der Dateigröße von 2-GB-Dateien ohne externe Programme in PHPDie Einschränkungen von PHP bei der Handhabung von Dateigrößen über 2 GB können...

Programmierung Veröffentlicht am 09.11.2024
Wie behebt man den Fehler „Bibliothek nicht geladen: libmysqlclient.16.dylib“ bei der Verwendung von MySQLdb in Python unter macOS?
Python: MySQLdb und „Bibliothek nicht geladen: libmysqlclient.16.dylib“SetupIn einem Versuch Um eine Entwicklungsumgebung für Python/Django auf macOS ...

Programmierung Veröffentlicht am 09.11.2024
Wie übergebe ich Funktionszeiger an C-Code mit Cgo in Go 1.6 und höher?
Übergabe eines Funktionszeigers an C-Code mit CgoÄnderungen bei der Übergabe von Cgo-FunktionszeigernIn Go 1.6 und höher gelten für Cgo strengere Rege...

Programmierung Veröffentlicht am 09.11.2024
Wie kann ich den Quellcode meiner Website vor unbefugtem Zugriff schützen?
Quellcode vor unbefugtem Zugriff schützenAndere daran zu hindern, Ihren Quellcode zu erhalten, kann eine Herausforderung sein. Sie können jedoch einig...

Programmierung Veröffentlicht am 09.11.2024
Wie bestimme ich die Anzahl der Ziffern einer Ganzzahl in Python?
Bestimmen der Länge von Ziffern innerhalb einer Ganzzahl in PythonIn Python ist das Ermitteln der Anzahl der Ziffern innerhalb einer Ganzzahl ein unko...

Programmierung Veröffentlicht am 09.11.2024
Geschichten über das Übernatürliche: Fabelwesen aus aller Welt
https://pageexplorer.blogspot.com/2024/10/tales-of-supernatural-mythical.html Ich würde mich freuen, wenn Sie sich meinen neuesten Blog-Beitrag ansehe...

Programmierung Veröffentlicht am 09.11.2024
Strukturmustervergleich in Python
Strukturmustervergleich ist eine leistungsstarke Funktion in Python, die es Ihnen ermöglicht, Entscheidungen auf der Grundlage der Struktur komplexer ...

Programmierung Veröffentlicht am 09.11.2024
Implementierung der kontextuellen Bindung zur Kompilierungszeit für die Zahlungsabwicklung in Laravel 11
In unserem vorherigen Beitrag (So fügen Sie Zahlungsverarbeitungsschnittstellen in Laravel 11 hinzu und implementieren sie: Fest codierte Bindung) hab...

Programmierung Veröffentlicht am 09.11.2024

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel