570 文字
3 分
Fault Domain とは?

障害ドメイン(Fault Domain)とは、同じ電源やネットワークスイッチを共有する物理的なハードウェア群を指します。具体的には、仮想マシンを配置するサーバーラック単位で管理されることが多いです。ある障害ドメインに障害が発生した場合でも、他の障害ドメインに配置されている仮想マシンは影響を受けないように設計されています。


Fault Domain(フォルトドメイン)とは#

フォルトドメイン(Fault Domain) とは、システムやネットワーク内で「同じ障害要因(シングルポイントオブフェイラー)」を共有するハードウェアやインフラの論理的なグループを指します。つまり、ある障害が発生した際に、その影響を受ける範囲を定義する単位です。

主な特徴#

  • 障害の局所化
    フォルトドメイン内の一部が故障すると、そのドメイン内の全リソースが影響を受ける可能性がありますが、他のフォルトドメインには影響しません。
  • 可用性向上のための分散配置
    仮想マシンやサービスを複数のフォルトドメインに分散して配置することで、1つのフォルトドメインで障害やメンテナンスが発生しても、他のドメインでサービスを継続できます。
  • クラウドやデータセンターでの活用
    例として、Oracle CloudやAzureなどのクラウドサービスでは、1つのアベイラビリティドメイン(データセンター)内に複数のフォルトドメインが存在し、物理サーバやラック、電源などを分離しています。

具体例#

  • サーバラック単位、電源供給単位、ネットワークスイッチ単位などがフォルトドメインとなることが多いです。
  • 例えば、同じラック内のサーバは同じフォルトドメインに属し、そのラックの電源障害やスイッチ障害が発生すると全サーバが影響を受けます。

フォルトドメインの設計意義#

  • システムの**耐障害性(レジリエンス)**を高めるために、重要なリソースやサービスを異なるフォルトドメインに分散配置することが推奨されます。
  • これにより、単一障害点の影響範囲を限定し、システム全体の可用性を向上させることができます。

まとめ
フォルトドメインは「同じ障害要因を共有するリソースのグループ」であり、障害発生時の影響範囲を限定し、システムの可用性と信頼性を高めるための重要な設計概念です。