GOPデップス認定


グーグルが悪魔を見る


そして、彼らは開発者と操作の間の潜在的な摩擦を議論します.変化対安定性.
私はそれが間違って説明していない神に感謝!🤓 閉じるこの動画はお気に入りから削除されています.
つの特徴を持つようにGoogleの概要devop
  • 組織サイロ
  • を減らします
  • 通常の
  • として失敗を受け入れる
  • は、徐々に変化
  • を実行します
  • レバレッジツールとオートメーション
  • は、すべて242479182を計ります

    ビデオコンテンツ SREに動く


    Googleは、オブジェクト指向のクラスがインタフェースを実装するかもしれない方法に類似した方法でサイト信頼性工学を考えます
    class SRE implements DevOps
    
    特にSREの意志
    開発者(組織サイロを減らす)による環境の共有
  • サービスレベルのオブジェクトと無傷のポストmortems
  • (漸進的な変更を実施する)
  • などの故障のコストを低減する
  • は、できるだけ多くの手動作業として排除します
    Canary releasesとシステム信頼性を測る

  • 労苦する レッツトーク


    私が愛しているこの部分.実際にどのように信頼性の高いあなたのシステムを質問する必要があります-どのような信頼性の高いエラーの予算が必要です.

    28日周期の3つのナイン= 99.9 % = 40分


    だから、監視システムの問題を発見するのに十分なだけで、誰かと人間の行動を取るに警告します.もちろん根本原因によって.

    28日周期の4つのナイン= 99.99 % = 4分


    今、あなたはマシンベースの検出と自己治癒の世界にしています.ソフトウェアの更新とロールアウトはおそらく分離された領域に分離する必要があります.

    28日の期間にわたって


    グッドラック!実際にダウンタイムのこの金額を見逃すためにあなたの監視システムの可能性もあります.あなたがアップタイムをチェックしている場合は想像してください、あなただけのダウンタイムの問題を逃している可能性があります誤ってあなたが';アップ';を報告した.
    今すぐGoogleクラウドのようなパブリッククラウドサービスを消費するためにそれらの考えを拡張します.サポートリクエストラウンドトリップを導入し、おそらくあなたの信頼性エラーの予算を消費している.
    どのように“利用可能”のスーパー興味深い考えは、システムがする必要がありますどのような含意はそれがあります.

    ストイプフト人



    OK私はそれを認める-私は自分自身を助けることができなかった…今日は模擬試験の1つを走らせた.あなたは、ちょうど私の隙間を理解するために知っています.
    私は、正しく13のうち7を得ました-およそ53 %.
    この段階での私のギャップは、特定のGoogle APIの周りの具体的にStackdriverの範囲内であり、セキュリティプラクティスをお勧めします.
    私と一緒に働いている誰にも-それはおそらく新しい情報