注意: 上記の埋め込みは github リポジトリからのもので、ここでクローンを作成できます。ただし、github でホストされているため、JS の対話機能はすべて無効になっており、「トグル ボタン」は表示されません。ただし、リポジトリをマシンに複製し、ノートブックをローカルで実行すると、ボタンが次のように表示されることがわかります:
そして、「切り替えボタン」をクリックすると、入力セルが非表示になり、次のような内容が残ります。
それで終わりです。要約すると、1 つの環境 (ノートブック) 内ですべてを実行できたことは次のとおりです。
すべてが 1 つの環境内にある、完全なエンドツーエンドの分析ワークフロー。次のステップは、レポートを関係者とシームレスに共有できるフレームワーク、テクノロジー、パイプラインを構築することです。この記事が十分な注目を集めたら、次にそれについて書きます。 ?
","image":"http://www.luping.net/uploads/20240826/172465956766cc376f39a45.jpg","datePublished":"2024-08-26T16:06:07+08:00","dateModified":"2024-08-26T16:06:07+08:00","author":{"@type":"Person","name":"luping.net","url":"https://www.luping.net/articlelist/0_1.html"}}あなたは目覚めます。 To Do リストを見ると、チーム メンバーからのタスクがあります。彼らはあなたに何らかの分析を行ってレポートを作成してほしいと考えています。リクエスト自体は比較的複雑です。つまり、問題ステートメントを使用してリクエストを分解し、データ ソースからデータを取得し、調査して洞察を収集し、その結果をチーム メンバーに伝える必要がある可能性があります。
この問題を解決する方法は次のとおりです:
データ専門家の日常生活は、標準的な 1 日のようですね。ただし、あなたはどうか知りませんが、これほど多くのツール間でデータを移動すると、かなり混乱する可能性があります。非常に非効率なワークフローになります。でも、もっと良い方法があると言ったらどうなるでしょうか?問題ステートメントを準備し、SQL クエリを作成し、分析を実行し、結果をすべて 1 か所で提示できると思いますか?データと Python を扱う場合は、アドホック分析用の優れたツールとして Jupyter Notebook をすでによくご存じでしょう。 Notebook のインタラクティブな環境では、逐次的な分析とストーリーテリングが可能です。しかし、Notebook の美しさは IPython との融合だけでは終わりません。 Jupyter Notebook は基本的に HTML、CSS、JS を使用して構築されています。つまり、これらのテクノロジーを使用してノートブックの機能を拡張できるということです。この記事では、Jupyter Notebook の Web インターフェイスと Python の豊富なデータ ライブラリを利用して、エンドツーエンドのレポート ソリューションを構築する方法を説明します。
手順を進めるには、次のソフトウェアやパッケージをシステムにインストールする必要があります:
SQL Server: これは、データ抽出のために対話する SQL 言語です
Aventure Works Database: これは、データのクエリを実行するデータベースのコレクションです。 AW データベースは通常、デフォルトで SQL Server インストールに付属しています。ただし、そうでない場合は、リンクをクリックし、SQL Server インストールにロードする方法の指示に従ってください。
Python と Jupyter: Python と Jupyter の両方を同時にインストールする最も簡単な方法は、anaconda ディストリビューションを使用することです。すでに Python を持っているが、Jupyter のみをインストールしたい場合は、このリンクを使用してください。
Python ライブラリ:
本題は終わりましたので、早速 Jupyter Notebook を見ていきましょう。以下に埋め込まれています:
注意: 上記の埋め込みは github リポジトリからのもので、ここでクローンを作成できます。ただし、github でホストされているため、JS の対話機能はすべて無効になっており、「トグル ボタン」は表示されません。ただし、リポジトリをマシンに複製し、ノートブックをローカルで実行すると、ボタンが次のように表示されることがわかります:
そして、「切り替えボタン」をクリックすると、入力セルが非表示になり、次のような内容が残ります。
それで終わりです。要約すると、1 つの環境 (ノートブック) 内ですべてを実行できたことは次のとおりです。
すべてが 1 つの環境内にある、完全なエンドツーエンドの分析ワークフロー。次のステップは、レポートを関係者とシームレスに共有できるフレームワーク、テクノロジー、パイプラインを構築することです。この記事が十分な注目を集めたら、次にそれについて書きます。 ?
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3