「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > MySQLDB SSCursor で fetchall() を使用することは、大規模なデータセットに対して実際に効率的ですか?

MySQLDB SSCursor で fetchall() を使用することは、大規模なデータセットに対して実際に効率的ですか?

2024 年 11 月 18 日に公開
ブラウズ:493

Is Using fetchall() with MySQLDB SSCursor Actually Efficient for Large Datasets?

大規模な結果セットに対する MySQLDB SSCursor の効率的な利用

数十万行以上を含む膨大な結果セットを処理する場合、効率的なメモリ管理が必要になります。重要な。そのため、MySQLDB SScursor (ストリーミング選択カーソル) は、メモリ消費を最小限に抑えるための適切なツールとして浮上します。

ベース カーソルを使用した Fetchall() と SSCursor の区別

一般的な考えに反して、SScursor から fetchall() を実行すると、ベース カーソルから実行するよりも多くのメモリが消費されます。これは、SScursor がサーバーから結果をチャンク単位で段階的にフェッチするのに対し、fetchall() は結果セット全体をメモリにダウンロードするためです。したがって、 fetchall() の使用は、メモリに制約のあるシナリオでは直観に反します。行ベースで、次の方法を使用します:

import MySQLdb.cursors 接続=MySQLdb.connect( ホスト = "ホスト"、ユーザー = "ユーザー"、 passwd="パスワード",db="データベース", カーソルクラス = MySQLdb.cursors.SSCursor) カーソル=接続.カーソル() カーソル.実行(クエ​​リ) カーソル内の行の場合: print(row)

このメソッドは、内容全体をメモリに保存せずに結果セットを反復処理し、最小限のリソースを消費します。

import MySQLdb.cursors
connection=MySQLdb.connect(
    host="thehost",user="theuser",
    passwd="thepassword",db="thedb",
    cursorclass = MySQLdb.cursors.SSCursor)

cursor=connection.cursor()
cursor.execute(query)

for row in cursor:
    print(row)

WHERE 句を指定するか LIMIT を使用して結果セットのサイズを制限します。

次の場合にサーバー側カーソルを使用します。可能です。

バッチ フェッチを採用して結果をグループで処理します。
  • 大きな結果セットを効率的に処理できる MariaDB の MyRocks などの代替データベース エンジンを検討します。
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3