في تحليل البيانات ، غالبًا ما يكون من المفيد بيانات البيانات إلى فئات لتبسيط تمثيلها وتحليلها. هذه تقنية شائعة عند العمل مع البيانات الرقمية ، مثل عند التعامل مع النسب المئوية. ["النسبة المئوية"]. الرأس () 46.5 44.2 100.0 42.12
لتثبيت هذا العمود والحصول على تعداد القيمة لكل صندوق ، يمكننا استخدام وظيفة pd.cut. فيما يلي طريقتان لتحقيق ذلك:
df['percentage'].head() 46.5 44.2 100.0 42.12باستخدام pd.cut مع value_counts:
df ['binned'] = pd.cut (df ['النسبة المئوية'] ، صناديق) print (df.groupby (df ['binned']). size ())
باستخدام np.searchsorted و groupby:
df['percentage'].head() 46.5 44.2 100.0 42.12df ['binned'] = NP.SearchSorted (bins ، df ['النسبة المئوية']. القيم) print (df.groupby (df ['binned']). size ()) (0 ، 1] 0 (1 ، 5] 0 (5 ، 10] 0 (10 ، 25] 0 (25 ، 50] 3 (50 ، 100] 1 dtype: int64
يشير هذا الإخراج إلى أنه لا توجد قيم في الصناديق (0 ، 1] ، (1 ، 5] ، (5 ، 10] ، (10 ، 25]. ثلاث قيم تقع في Bin (25 ، 50] ، وتسقط قيمة واحدة في الصندوق (50 ، 100].
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3