「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > 実稼働準備チェックリスト

実稼働準備チェックリスト

2024 年 8 月 5 日に公開
ブラウズ:618

Production Readiness Checklist

アプリケーションを PoC から本番環境に移行する複数のプロジェクトに取り組んでいます。
これらは、本番の準備が整っていることを確認するために、私自身と私のチームのために用意したチェックリストです。
ここでは、アプリケーションが Python プログラミング言語で作成され、Kubernetes 経由で AWS にデプロイされるため、チェックリストに重点が置かれています。
これらすべてが必須というわけではありませんが、私が最も便利だと感じたものです。

1. アラートとメトリクス

  • [ ] インフラストラクチャの問題 (メモリや CPU 使用率の増加、サービスの利用不能など) についてアラートが設定されていますか?
  • [ ] アプリケーション固有の重大なロジック障害に対してアラートが設定されていますか?
  • [ ] インフラストラクチャとリソースの使用状況の履歴データ (過去数時間/数日) を表示できますか?
  • [ ] リアルタイム監視ダッシュボードは設置されていますか?

2. ダッシュボードとSOP

  • [ ] アラートと既知の問題を処理するための SOP 文書はありますか?
  • [ ] 一般的なシナリオに利用できる Runbook はありますか?
  • [ ] インシデント対応計画は整備されていますか?

3. オンコールマッピングとリズム

  • [ ] アプリケーションレベルの問題に対するオンコール担当者のマッピングはありますか?
  • [ ] インフラストラクチャ関連の問題に対するオンコール担当者のマッピングはありますか?
  • [ ] 定義されたローテーション スケジュールとエスカレーション ポリシーはありますか?

4.展開

  • [ ] 適切なインスタンス タイプ (GPU または CPU) は決定されましたか?
  • [ ] 必要なサーバーの種類は指定されていますか?
  • [ ] フェイルオーバー用のマルチアベイラビリティゾーンのサポートはありますか?
  • [ ] 複数のリージョンはサポートされていますか?
  • [ ] トラフィックの急増に備えて自動スケーリングが設定されていますか?
  • [ ] サーバーにヘルスチェックが設定されていますか?
  • [ ] リソース制限は定義され、文書化されていますか?
  • [ ] Blue-Green または Canary の展開戦略は導入されていますか?
  • [ ] 定義されたロールバック計画と手順はありますか?

5. 可観測性と追跡

  • [ ] 関連するメトリクス (リクエスト数、HTTP ステータス コード、使用状況など) を表示するダッシュボードはありますか?
  • [ ] デバッグ目的で 1 つのリクエストをエンドツーエンドで追跡できますか?
  • [ ] ログの集約および分析システムは導入されていますか?
  • [ ] 分散トレーシングは実装されていますか?

6. 負荷テスト

  • [ ] サーバーの負荷処理能力を決定するために容量計画が実行されましたか?
  • [ ] 定義されたパフォーマンス ベンチマークはありますか?
  • [ ] ストレステストは実施されましたか?

7. 品質

  • [ ] 自動化された単体テストはありますか?
  • [ ] 自動統合テストはありますか?
  • [ ] 静的コード分析 (複雑さのチェックなど) は実行されていますか?
  • [ ] コード カバレッジは測定され、許容レベルにありますか?
  • [ ] 本番環境の健全性テスト ケースはありますか?
  • [ ] CI/CD パイプラインは配置されていますか?
  • [ ] セキュリティ スキャンと脆弱性評価は定期的に実行されていますか?

8. リリース

  • [ ] Swagger/OpenAPI ドキュメントは入手可能で最新ですか?
  • [ ] API とリリースのバージョン管理システムはありますか?
  • [ ] 定期メンテナンスのための通信チャネルは確立されていますか?
  • [ ] 変更管理プロセスはありますか?
  • [ ] 機能フラグは新機能の段階的なロールアウトに使用されますか?

9. 災害復旧と事業継続

  • [ ] バックアップと復元の手順は整備され、テストされていますか?
  • [ ] データ複製戦略はありますか?
  • [ ] 目標復旧時間 (RTO) と目標復旧時点 (RPO) は定義されていますか?
  • [ ] 災害復旧訓練は定期的に実施されていますか?

10. コンプライアンスとセキュリティ

  • [ ] データは保存中および転送中に暗号化されていますか?
  • [ ] アクセス制御と認証メカニズムは導入されていますか?
  • [ ] 定期的なセキュリティ監査は実施されていますか?
  • [ ] アプリケーションは関連する業界標準 (GDPR、HIPAA など) に準拠していますか?

11. ドキュメント

  • [ ] システム アーキテクチャのドキュメントは入手可能で最新のものですか?
  • [ ] API ドキュメントは完全で最新のものですか?
  • [ ] 操作手順は文書化されていますか?
  • [ ] 包括的なトラブルシューティング ガイドはありますか?
リリースステートメント この記事は、https://dev.to/souumendrak/production-readness-checklist-1io5?1に再現されています。
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3