在數據分析中使用pandas
假設我們有一個數據幀列,名為“百分比”包含數字值['百分比']。 head() 46.5 44.2 100.0 42.12df['percentage'].head() 46.5 44.2 100.0 42.12使用np.searchsorted and groupby:
='] ='] ='] = np.searchsorted(bins,df ['百分比']。值) print(df.groupby(df ['binned'])。size())
0 (1,5] 0 (5,10] 0 (10,25] 0 (25,50] 3 (50,100] 1 dtype:int64此輸出表明箱中沒有值(0,1],(1,5],(5,10)和(10,15])。三個值落在bin(25 ,50],一個值落在垃圾箱中(50,100]。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3