Wie kann man große CSV -Dateien in Python 2.7 effektiv behandeln?

Titelseite > Programmierung > Wie kann man große CSV -Dateien in Python 2.7 effektiv behandeln?

Wie kann man große CSV -Dateien in Python 2.7 effektiv behandeln?

Gepostet am 2025-03-05

Durchsuche:471

How to Effectively Handle Large CSV Files in Python 2.7?

Lesen großer .csv -Dateien in Python

Problem: massive .csv -Dateien (bis zu 1 Million Zeilen, 200 Kolumnen) in Python 2.7 begleitet Speicherfehler. Diese Methode wird jedoch für große Dateien unpraktisch, da sie übermäßige Erinnerung verbraucht.

Lösung:

1. Verarbeiten Sie Zeiger, sobald sie produziert werden:

vermeiden Sie das Laden der gesamten Datei in Speicher. Verarbeiten Sie stattdessen Zeilen, sobald sie mit einer Generatorfunktion generiert werden.

def getstuff (Dateiname, Kriterium): mit offenem (Dateiname, "RB") als CSVFile: DataReader = CSV.Reader (CSVFile) Nächste Ertrag (DataReader) # Ergeben Sie die Header -Zeile Für Zeile in DataReader: Wenn Zeile [3] == Kriterium: Relief row

def getstuff(filename, criterion):
    with open(filename, "rb") as csvfile:
        datareader = csv.reader(csvfile)
        yield next(datareader)  # yield the header row
        for row in datareader:
            if row[3] == criterion:
                yield row

2. Verwenden Sie Generatorfunktionen zum Filtern:

Filterdaten beim Iterieren der Datei mit Generatorfunktionen filtern. Dieser Ansatz ermöglicht die Übereinstimmung mehrerer aufeinanderfolgender Zeilen, die ein bestimmtes Kriterium erfüllen.

def getstuff (Dateiname, Kriterium): mit offenem (Dateiname, "RB") als CSVFile: DataReader = CSV.Reader (CSVFile) Nächste Ertrag (DataReader) # Ergeben Sie die Header -Zeile Ergeben von Take the Take ( Lambda R: R [3] == Kriterium, DropHiny (Lambda R: R [3]! = Kriterium, DataReader)) return

def getstuff(filename, criterion):
    with open(filename, "rb") as csvfile:
        datareader = csv.reader(csvfile)
        yield next(datareader)  # yield the header row
        for row in datareader:
            if row[3] == criterion:
                yield row

3. Optimieren Sie den Speicherkonsum:

Refactor getData (), um auch eine Generatorfunktion zu verwenden, um sicherzustellen, dass nur eine Zeile in Erinnerung bleibt.

def getData (Dateiname, Kriterien): für Kriterien in Kriterien: Für Row in GetStuff (Dateiname, Kriterium): Rendite row

def getstuff(filename, criterion):
    with open(filename, "rb") as csvfile:
        datareader = csv.reader(csvfile)
        yield next(datareader)  # yield the header row
        for row in datareader:
            if row[3] == criterion:
                yield row

Zusätzliche Tipps für Geschwindigkeit:

Lesen Sie Dateien in kleineren Chunks, um die Memory Footprint zu reduzieren. Es in einer Datenbank für eine schnellere und effizientere Verarbeitung.

Neuestes Tutorial Mehr>

Wie kann ich Kompilierungsoptimierungen im Go -Compiler anpassen?
Anpassung von Kompilierungsoptimierungen in Go Compiler Der Standardkompilierungsprozess in Go folgt einer spezifischen Optimierungsstrategie....

Programmierung Gepostet am 2025-04-18
Wie rufe ich die neueste JQuery -Bibliothek von Google APIs ab?
abrufen die neueste jQuery -Bibliothek von Google apis Die bereitgestellte jQuery -URL in der Frage ist für Version 1.2.6. Für das Abrufen der...

Programmierung Gepostet am 2025-04-18
Anleitung zum Festlegen der Autorisierungsheader mit WinRT HTTPClient
Hinzufügen von Autorisierungsheadern zu Winrts httpclient winrt's httpclient fehlt die .Net Anmeldeinform Klasse für die Festlegung von ...

Programmierung Gepostet am 2025-04-18
Wie kann man eine generische Hash -Funktion für Tupel in ungeordneten Sammlungen implementieren?
generische Hash -Funktion für Tupel in nicht ordnungsgemäßen Sammlungen Die std :: unbestrahlte_Map und std :: unconded_set Container bieten e...

Programmierung Gepostet am 2025-04-18
Effektive Überprüfungsmethode für Java-Zeichenfolgen, die nicht leer und nicht null sind
prüfen, ob ein String nicht null ist und nicht leer , ob ein String nicht null und nicht leer ist, Java bietet verschiedene Methoden. 1.6 and l...

Programmierung Gepostet am 2025-04-18
`console.log` zeigt den Grund für die modifizierte Objektwertausnahme an
objekte und console.log: Eine Kuriosität enträtselte Wenn Sie mit Objekten und Console.log arbeiten, können Sie ein merkwürdiges Verhalten auf...

Programmierung Gepostet am 2025-04-18
Wie kann ich Daten in einer Transaktion effizient in mehrere MySQL -Tabellen einfügen?
mySql Einfügen in mehrere Tabellen versuchen, Daten mit einer einzelnen MySQL -Abfrage in mehrere Tabellen einzufügen. Während es so aussehen ...

Programmierung Gepostet am 2025-04-18
So laden Sie Dateien mit zusätzlichen Parametern mit java.net.urlconnection und Multipart/Form-Data-Codierung hoch?
Dateien mit Http-Anfragen hochladen , um Dateien auf einen HTTP-Server hochzuladen und gleichzeitig zusätzliche Parameter zu senden. Hier ist e...

Programmierung Gepostet am 2025-04-18
Lösen
mySql ERROR 1153: Fehlerbehebung hat ein Paket, das größer ist als 'max_allowed_packet' bytes dem ättigmatischen MySQL -Fehler 1153 wä...

Programmierung Gepostet am 2025-04-18
Wie konvertieren Sie eine Pandas -Datenfream -Spalte in das DateTime -Format und filtern nach Datum?
pandas dataframe -spalte in datetime format szenario: Daten in einem Pandas DataFrame existieren häufig in verschiedenen Formaten, einschlie...

Programmierung Gepostet am 2025-04-18
Wie kann ich das CSS-Attribut der ": After" -Pseudo-Element mit JQuery effektiv ändern?
die Einschränkungen von Pseudo-Elementen in jQuery: Zugriff auf die ": After" selector in Webentwicklung, Pseudo-Elemente mögen &quo...

Programmierung Gepostet am 2025-04-18
Wie beheben Sie die Diskrepanzen für Modulpfade in Go -Mod mithilfe der Richtlinie Ersetzen?
überwinden Modulpfad -Diskrepanz in go mod Wenn GO mod verwendet wird, ist es möglich, auf einen Konflikt zu begegnen, bei dem ein Drittanbiet...

Programmierung Gepostet am 2025-04-18
Wie kann ich nach der Bearbeitung von Zellen eine kundenspezifische JTable -Zell -Rendering beibehalten?
beibehalten von jtable cell rendering nach cell edit in einem jtable, in dem benutzerdefinierte Zellenwiedergabe implementiert werden, kann di...

Programmierung Gepostet am 2025-04-18
Wie kann ich exklusive Zeiger als Funktions- oder Konstruktorparameter in C ++ übergeben?
Managing Unique Pointers as Parameters in Constructors and FunctionsUnique pointers (unique_ptr) uphold the principle of unique ownership in C 11. Wh...

Programmierung Gepostet am 2025-04-18
Warum zeigt keine Firefox -Bilder mithilfe der CSS `Content` -Eigenschaft an?
Bilder mit Inhalts -URL in Firefox Es wurde ein Problem aufgenommen, an dem bestimmte Browser, speziell Firefox, nicht in den Verweisen der In...

Programmierung Gepostet am 2025-04-18

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel