مقارنة إطارات البيانات جنبًا إلى جنب لتحليل التغيير الشامل
لتسليط الضوء على التناقضات بين إطاري بيانات، توجد طريقة فعالة تلغي الحاجة لإجراء مقارنات شاقة صفًا تلو الآخر وعمودًا تلو الآخر. من خلال الاستفادة من وظائف Python Pandas المحددة، من الممكن تحديد التغييرات عبر أنواع البيانات المختلفة (على سبيل المثال، int، وfloat، وboolean، وstring) وتقديمها بتنسيق جدول HTML بديهي.
للبدء، حدد ما إذا كان أي منها تم تغيير الصفوف باستخدام الدالة المنطقية (df1 != df2).any(1). بعد ذلك، لتحديد إدخالات معينة تم تغييرها، استخدم ne_stacked = (df1 != df2).stack() وقم بتصفية القيم غير المتغيرة باستخدام Change = ne_stacked[ne_stacked].
للحصول على التغيير الفعلي القيم، قم بدمج Difference_locations = np.where(df1!= df2)، الذي يحدد مواقع البيانات التي تم تغييرها. استخرج القيم من إطار البيانات الأصلي (df1) في هذه المواقع باستخدام Change_from = df1.values[difference_locations]. وبالمثل، قم باستخراج القيم المقابلة من إطار البيانات الثاني (df2) باستخدام Change_to = df2.values[difference_locations].
لتقديم الاختلافات بشكل شامل، قم بإنشاء DataFrame من خلال الجمع بين Change_from وchanged_to كأعمدة، وتعيين الفهرس لتتناسب مع المتغير الذي تم تغييره. سيوفر DataFrame هذا عرضًا واضحًا جنبًا إلى جنب للتغييرات، مع تسليط الضوء على القيم الأصلية والمحدثة لكل نقطة بيانات.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3