دمج إطارات بيانات متعددة بشكل فعال باستخدام Pandas
عند العمل مع مشاريع علوم البيانات، غالبًا ما يكون من الضروري دمج إطارات بيانات متعددة لدمج معلوماتها. يمكن أن تكون هذه مهمة معقدة، خاصة عند التعامل مع إطارات بيانات متعددة قد تحتوي على هياكل وأعداد صفوف مختلفة. التعليمات البرمجية المقدمة، قد لا تكون أفضل طريقة لدمج إطارات بيانات متعددة بكفاءة. على الرغم من أن التكرار يمكن أن يحل بعض أنواع المشكلات بشكل فعال، إلا أنه ليس مثاليًا لهذه المهمة تحديدًا. يمكن أن تؤدي إلى حسابات غير ضرورية ويمكن أن تكون معقدة في التعامل معها.
Pandas: حل شامل
Pandas، مكتبة قوية لمعالجة بيانات Python، توفر حلاً بسيطًا وفعالاً. طريقة دمج إطارات بيانات متعددة. فهو يسمح لكل من الصلات الداخلية والخارجية، بالإضافة إلى القدرة على تحديد المفتاح (المفاتيح) التي يجب إجراء الدمج عليها.
الدمج باستخدام Pandas.merge
لدمج إطاري بيانات df1 وdf2 باستخدام Pandas، يمكنك استخدام طريقة .merge()، كما يلي:
merged_df = df1.merge(df2, on='date')هنا، يمثل "التاريخ" العمود الذي يتم تنفيذ الدمج عليه.
حل أكثر أناقة: تقليل () ووظيفة Lambda
merged_df = df1.merge(df2, on='date')لدمج إطارات بيانات متعددة، إحدى الطرق الأكثر وضوحًا هي استخدام الدالة الاختزالية () مع دالة لامدا، كما هو موضح أدناه:dfs = [df1, df2, df3] df_merged = تقليل(lambda left, right: pd.merge(left, right, on='date', how='outer'), dfs)
في هذا المثال:
dfs هي قائمة تحتوي على إطارات البيانات المراد دمجها.
dfs = [df1, df2, df3] df_merged = reduce(lambda left, right: pd.merge(left, right, on='date', how='outer'), dfs)
يتم استخدام عمود "التاريخ" كمفتاح دمج.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3