こんにちは!?
今日は、Jupyter でデータを操作する方法を示す新しいノートブックを持って戻ってきました。
からデータセットをダウンロードしました
Kaggle は、現実世界のデータを見つけて他のデータ愛好家とつながるためのプラットフォームです。
そこでは、驚くべきデータセットとプロジェクトのコレクションが見つかり、コンテストに参加することもできます。
データフレームの簡潔な概要を返した後、データのクリーニングを実行して、データを分析に使用できる一貫した形式に変換しました
astype() メソッドは、pandas オブジェクトを指定されたデータ型に変換するために使用されます。
最初に発生したエラーを取り除くためにfillna(0)を使用しました。あなたも試してみてください!
私の GitHub リポジトリで詳細を見つけることができます。ここでノートブックともちろんデータセットをアップロードしました。簡単に言うと、
の方法を学びます。データフレームをロードします、
メタデータを調べます、
データ型を変換
iloc インデックスを使用してデータフレームを探索します。
さらに、ブール マスキングと中央値の計算方法についても学びます。 ?
データを探索する準備はできていますか?
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3