كيفية حساب تجزئة MD5 للملفات الكبيرة بكفاءة في بايثون

الصفحة الأمامية > برمجة > كيفية حساب تجزئة MD5 للملفات الكبيرة بكفاءة في بايثون

كيفية حساب تجزئة MD5 للملفات الكبيرة بكفاءة في بايثون

تم النشر بتاريخ 2024-11-04

تصفح:723

How to Efficiently Compute MD5 Hash of Large Files in Python

حساب تجزئة MD5 للملفات الكبيرة بكفاءة في Python

في بعض السيناريوهات، يصبح من الضروري حساب تجزئة MD5 للملفات الكبيرة التي تتجاوز ذاكرة الوصول العشوائي المتوفرة. وظيفة بايثون الأصلية hashlib.md5() ليست مناسبة لمثل هذه السيناريوهات لأنها تتطلب تحميل الملف بأكمله في الذاكرة.

للتغلب على هذا القيد، النهج العملي هو قراءة الملف في أجزاء يمكن التحكم فيها و تحديث التجزئة بشكل متكرر. وهذا يسمح بحساب التجزئة بكفاءة دون تجاوز حدود الذاكرة.

تنفيذ التعليمات البرمجية

import hashlib

def md5_for_file(f, block_size=2**20):
    md5 = hashlib.md5()
    while True:
        data = f.read(block_size)
        if not data:
            break
        md5.update(data)
    return md5.digest()

مثال للاستخدام

لحساب تجزئة MD5 لملف، استخدم بناء الجملة التالي:

with open(filename, 'rb') as f:
    md5_hash = md5_for_file(f)

سيحتوي المتغير md5_hash على تجزئة MD5 المحسوبة ككائن يشبه البايت.

اعتبارات إضافية

تأكد من فتح الملف بالنظام الثنائي الوضع ('rb') لتجنب النتائج غير الصحيحة. لمعالجة الملفات بشكل شامل، خذ بعين الاعتبار الوظيفة التالية:

import os
import hashlib

def generate_file_md5(rootdir, filename, blocksize=2**20):
    m = hashlib.md5()
    with open(os.path.join(rootdir, filename), 'rb') as f:
        while True:
            buf = f.read(blocksize)
            if not buf:
                break
            m.update(buf)
    return m.hexdigest()

تأخذ هذه الوظيفة مسار الملف وترجع تجزئة MD5 كسلسلة سداسية عشرية.

باستخدام هذه التقنيات، يمكنك حساب تجزئة MD5 بكفاءة للملفات الكبيرة دون مواجهة قيود الذاكرة.

بيان الافراج أعيد طبع هذه المقالة على: 1729387820 في حالة وجود أي انتهاك، يرجى الاتصال بـ [email protected] لحذفها

أحدث البرنامج التعليمي أكثر>

كيف يمكنني استبدال سلاسل متعددة بكفاءة في سلسلة Java؟
ومع ذلك ، يمكن أن يكون هذا غير فعال بالنسبة للسلاسل الكبيرة أو عند العمل مع العديد من الأوتار. تتيح لك التعبيرات العادية تحديد أنماط البحث المعقدة ...

برمجة نشر في 2025-04-12
كيفية إعادة توجيه أنواع متعددة للمستخدمين (الطلاب والمعلمين والمسؤولين) إلى أنشطتهم في تطبيق Firebase؟
تسجيل الدخول. يدير الكود الحالي بنجاح إعادة التوجيه لنوعين للمستخدمين ، ولكنه يواجه تحديات عند محاولة دمج النوع الثالث (المسؤول). يخطط المخطط الأص...

برمجة نشر في 2025-04-12
كيف يمكنك استخراج عنصر عشوائي من صفيف في PHP؟
اختيار عشوائي من صفيف في PHP ، يمكن تحقيق عنصر عشوائي من صفيف بسهولة. ضع في اعتبارك المصفوفة التالية: $items = [523, 3452, 334, 31, 5346];

برمجة نشر في 2025-04-12
كيف يمكنني اتحاد جداول قاعدة البيانات مع أرقام مختلفة من الأعمدة؟
الجداول مجتمعة مع أعمدة مختلفة ] يمكن أن تواجه تحديات عند محاولة دمج جداول قاعدة البيانات بأعمدة مختلفة. تتمثل الطريقة المباشرة في إلحاق القيم ...

برمجة نشر في 2025-04-12
كيفية الحد من نطاق التمرير لعنصر داخل عنصر الوالد الحجم ديناميكي؟
يتضمن أحد هذه السيناريو الحد من نطاق التمرير لعنصر داخل عنصر الوالدين ديناميكيًا. المشكلة: ومع ذلك ، يمتد تمرير الخريطة إلى أجل غير مسمى ، ويتج...

برمجة نشر في 2025-04-12
هل أحتاج إلى حذف تخصيصات الكومة بشكل صريح في C ++ قبل خروج البرنامج؟
هذه المقالة تتعطل في هذا الموضوع. في الوظيفة الرئيسية C ، يتم استخدام مؤشر لمتغير مخصص ديناميكيًا (ذاكرة الكومة). مع خروج التطبيق ، هل تم إصدار ه...

برمجة نشر في 2025-04-12
هل تسمح Java بأنواع عائدات متعددة: نظرة فاحصة على الطرق العامة؟
أنواع عائدات متعددة في java: تم الكشف عن المفاهيم الخاطئة getResult (String s) ؛ حيث Foo فئة مخصصة. يبدو أن إعلان الطريقة يضم نوعين من الإرج...

برمجة نشر في 2025-04-12
كيفية تحويل عمود DataFrame Pandas إلى تنسيق DateTime وتصفية حسب التاريخ؟
تحويل عمود DataFrame pandas إلى تنسيق DateTime عند العمل مع البيانات الزمنية ، قد تظهر الطوابع الزمنية في البداية كسلاسل ولكن يجب تحويلها إلى تنس...

برمجة نشر في 2025-04-12
كيفية التعامل مع مدخلات المستخدم في الوضع الحصري لشروط جافا؟
تستكشف هذه المقالة النهج الصحيح للتعامل مع إدخال المستخدم من لوحة المفاتيح والماوس في هذا الوضع. ومع ذلك ، في وضع كامل الشاشة الحصري ، قد لا تعمل ه...

برمجة نشر في 2025-04-12
ما هي القيود المفروضة على استخدام Current_Timestamp مع أعمدة الطابع الزمني في MySQL قبل الإصدار 5.6.5؟
Current_timestamp جملة. امتد هذا القيد إلى أعداد صحيحة ، و bigint ، و smallint عندما تم تقديمها في البداية في عام 2008. Current_Timestamp Value: إ...

برمجة نشر في 2025-04-12
كيفية تعيين مفاتيح ديناميكي في كائنات JavaScript؟
كيفية إنشاء مفتاح ديناميكي لمتغير كائن JavaScript يستخدم النهج الصحيح بين قوسين مربعين: jsObj['key' i] = 'example' 1; لتسديد خاصية مع مفتاح...

برمجة نشر في 2025-04-12
كيف يمكنني تكرار القيم والطباعة بشكل متزامن من صفائف متساوية في الحجم في PHP؟
تكرار وطباعة بشكل متزامن من صفيفتين من نفس الحجم المصفوفات: foreach (رموز $ كرمز $ وأسماء $ كاسم $) { ... } هذا النهج غير صالح. بدلاً من ...

برمجة نشر في 2025-04-12
كيفية تحليل الأرقام في تدوين الأسي باستخدام decimal.parse ()؟
تحليل رقم من الترميز الأسي عند محاولة تحليل سلسلة معبر عنها في ترميز أسي باستخدام decimal.parse ("1.2345e-02") ، قد تصادف خطأ. وذلك ...

برمجة نشر في 2025-04-12
كيفية الجمع بين البيانات من ثلاثة جداول MySQL في جدول جديد؟
الأشخاص والتفاصيل وجداول التصنيف؟ الإجابة: حدد ص.*، د. من الناس ك انضم إلى التفاصيل كـ D على D.Person_id = p.id انضم إلى التصنيف كـ t على t....

برمجة نشر في 2025-04-12
كيف تستخدم بشكل صحيح مثل الاستعلامات مع معلمات PDO؟
استخدام مثل الاستعلامات في pdo عند محاولة تنفيذ الاستفسارات في pdo ، قد تواجه مشكلات مثل تلك الموصوفة في الاستعلام أدناه: $ params = array ($ ...

برمجة نشر في 2025-04-12