データセット ノイズを伴う曲線の平滑化: 実践ガイド
ノイズの多いデータセットの曲線を平滑化することは、データ分析における一般的な課題です。これに対処するには、ノイズによる 20% の変動があるデータセットを考慮します。
import numpy as np x = np.linspace(0, 2*np.pi, 100) y = np.sin(x) np.random.random(100) * 0.2
この状況では、Savitzky-Golay フィルターが効果的な選択肢です。このフィルターは、データ ポイントのウィンドウに多項式を当てはめ、その多項式を使用してウィンドウの中心の値を推定することによって機能します。次に、ウィンドウがデータに沿って移動され、プロセスが繰り返され、滑らかな曲線が得られます。
Python で Savitzky-Golay フィルターを実装する方法は次のとおりです。
import numpy as np
import matplotlib.pyplot as plt
yhat = savgol_filter(y, 51, 3) # window size 51, polynomial order 3
plt.plot(x, y)
plt.plot(x, yhat, color='red')
plt.show()
結果の曲線は、基礎となる信号を保持しながら、元の曲線よりも滑らかになります。
注: savgol_filter 関数がない場合利用可能な場合は、次のコマンドを使用してインストールできます:
pip install scipy
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3