注意: 上記の埋め込みは github リポジトリからのもので、ここでクローンを作成できます。ただし、github でホストされているため、JS の対話機能はすべて無効になっており、「トグル ボタン」は表示されません。ただし、リポジトリをマシンに複製し、ノートブックをローカルで実行すると、ボタンが次のように表示されることがわかります:

\\\"Jupyter

そして、「切り替えボタン」をクリックすると、入力セルが非表示になり、次のような内容が残ります。

\\\"Jupyter

それで終わりです。要約すると、1 つの環境 (ノートブック) 内ですべてを実行できたことは次のとおりです。

すべてが 1 つの環境内にある、完全なエンドツーエンドの分析ワークフロー。次のステップは、レポートを関係者とシームレスに共有できるフレームワーク、テクノロジー、パイプラインを構築することです。この記事が十分な注目を集めたら、次にそれについて書きます。 ?

","image":"http://www.luping.net/uploads/20240826/172465956766cc376f39a45.jpg","datePublished":"2024-08-26T16:06:07+08:00","dateModified":"2024-08-26T16:06:07+08:00","author":{"@type":"Person","name":"luping.net","url":"https://www.luping.net/articlelist/0_1.html"}}
「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > エンドツーエンドの分析ソリューションとしての Jupyter Notebook

エンドツーエンドの分析ソリューションとしての Jupyter Notebook

2024 年 8 月 26 日に公開
ブラウズ:584

導入

あなたは目覚めます。 To Do リストを見ると、チーム メンバーからのタスクがあります。彼らはあなたに何らかの分析を行ってレポートを作成してほしいと考えています。リクエスト自体は比較的複雑です。つまり、問題ステートメントを使用してリクエストを分解し、データ ソースからデータを取得し、調査して洞察を収集し、その結果をチーム メンバーに伝える必要がある可能性があります。

この問題を解決する方法は次のとおりです:

  • タスク追跡プラットフォーム (Trello、Jira など) で問題ステートメントを作成する
  • データ ソースからデータを取得します (SSMS、Power Query などのインターフェイスを使用した SQL データベースなど)
  • 分析ツール (Python、R、Excel) で探索的なデータ分析と複雑な変換を実行する
  • 洞察を特定し、それをマグルにわかりやすい方法で提示します (パワーポイント、または苦手な場合は Tableau や Power BI などの視覚化ツール)

データ専門家の日常生活は、標準的な 1 日のようですね。ただし、あなたはどうか知りませんが、これほど多くのツール間でデータを移動すると、かなり混乱する可能性があります。非常に非効率なワークフローになります。でも、もっと良い方法があると言ったらどうなるでしょうか?問題ステートメントを準備し、SQL クエリを作成し、分析を実行し、結果をすべて 1 か所で提示できると思いますか?データと Python を扱う場合は、アドホック分析用の優れたツールとして Jupyter Notebook をすでによくご存じでしょう。 Notebook のインタラクティブな環境では、逐次的な分析とストーリーテリングが可能です。しかし、Notebook の美しさは IPython との融合だけでは終わりません。 Jupyter Notebook は基本的に HTML、CSS、JS を使用して構築されています。つまり、これらのテクノロジーを使用してノートブックの機能を拡張できるということです。この記事では、Jupyter Notebook の Web インターフェイスと Python の豊富なデータ ライブラリを利用して、エンドツーエンドのレポート ソリューションを構築する方法を説明します。

手順を進めるには、次のソフトウェアやパッケージをシステムにインストールする必要があります:

SQL Server: これは、データ抽出のために対話する SQL 言語です
Aventure Works Database: これは、データのクエリを実行するデータベースのコレクションです。 AW データベースは通常、デフォルトで SQL Server インストールに付属しています。ただし、そうでない場合は、リンクをクリックし、SQL Server インストールにロードする方法の指示に従ってください。
Python と Jupyter: Python と Jupyter の両方を同時にインストールする最も簡単な方法は、anaconda ディストリビューションを使用することです。すでに Python を持っているが、Jupyter のみをインストールしたい場合は、このリンクを使用してください。
Python ライブラリ:

  • pyodbc
  • パンダ
  • SQLalchemy
  • プロット
  • mlxtend
  • ネットワークx

本題は終わりましたので、早速 Jupyter Notebook を見ていきましょう。以下に埋め込まれています:

注意: 上記の埋め込みは github リポジトリからのもので、ここでクローンを作成できます。ただし、github でホストされているため、JS の対話機能はすべて無効になっており、「トグル ボタン」は表示されません。ただし、リポジトリをマシンに複製し、ノートブックをローカルで実行すると、ボタンが次のように表示されることがわかります:

Jupyter Notebooks as an End-to-End Analytics Solution

そして、「切り替えボタン」をクリックすると、入力セルが非表示になり、次のような内容が残ります。

Jupyter Notebooks as an End-to-End Analytics Solution

それで終わりです。要約すると、1 つの環境 (ノートブック) 内ですべてを実行できたことは次のとおりです。

  • 問題ステートメントを定義し、目的を拡張します
  • SQL データベースに接続し、SQL データベースから直接データをクエリします
  • 分析を実行します
  • プロットビジュアライゼーション
  • マークダウンを使用してセクション、レイアウト、結果をフォーマットしてストーリーを伝え、技術者以外の読者でもレポートを読めるようにします
  • 技術的な入力を非表示にして、ストーリーと洞察だけを残す機能を提供します

すべてが 1 つの環境内にある、完全なエンドツーエンドの分析ワークフロー。次のステップは、レポートを関係者とシームレスに共有できるフレームワーク、テクノロジー、パイプラインを構築することです。この記事が十分な注目を集めたら、次にそれについて書きます。 ?

リリースステートメント この記事は次の場所に転載されています: https://dev.to/simsights/jupyter-notebooks-as-an-end-to-end-analytics-solution-2d1o?1 侵害がある場合は、[email protected] までご連絡ください。それを削除するには
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3