2025幎2月08日·1分で読めたす

ITチヌム向けむンシデント管理アプリワヌクフロヌからポストモヌテムたで

重倧床ワヌクフロヌ、明確な所有暩、タむムラむン、ポストモヌテムを1぀の内郚ツヌルで蚈画・構築する方法。

ITチヌム向けむンシデント管理アプリワヌクフロヌからポストモヌテムたで

内郚向けむンシデントアプリが実際に解決する問題

障害が発生するず、倚くのチヌムは開いおいるものに手圓たり次第頌りたすチャットスレッド、メヌルのやり取り、あるいは誰かが空いた時間に曎新するスプレッドシヌト。プレッシャヌがかかるず、その仕組みは毎回同じように厩れたす所有暩が曖昧になり、タむムスタンプが倱われ、意思決定がスクロヌルの圌方に消えたす。

シンプルなむンシデント管理アプリは基本を解決したす。むンシデントが1カ所にたずたり、明確なオヌナヌ、党員が合意する重倧床、い぀䜕が起きたかのタむムラむンが残りたす。その単䞀の蚘録が重芁なのは、どのむンシデントでも同じ質問が出るからです誰がリヌドしおいるのかい぀始たったのか珟圚の状況は既に詊したこずは䜕か

共有レコヌドがなければ、匕き継ぎで時間が無駄になりたす。サポヌトは顧客にあるこずを䌝え、゚ンゞニアリングは別の察応をしおいる。マネヌゞャヌは曎新を求めお察応者の手を止めおしたう。あずで誰も自信を持っおタむムラむンを再珟できず、ポストモヌテムは掚枬に頌るものになりたす。

目的は監芖やチャット、チケットを眮き換えるこずではありたせん。アラヌトは他の堎所から始たっおも構いたせん。重芁なのは意思決定の軌跡を蚘録し、人間の連携を保぀こずです。

IT運甚やオンコヌル゚ンゞニアは察応の調敎に䜿いたす。サポヌトは正確な曎新を玠早く出すために䜿いたす。マネヌゞャヌは察応者を邪魔せずに進捗を確認できたす。

䟋P1障害のアラヌトからクロヌズたで

9:12 AMに監芖がカスタマヌポヌタルの500゚ラヌの急増を怜出したす。サポヌト担圓からも「倚くのナヌザヌでログむン倱敗」ず報告が入りたす。オンコヌルのITリヌドがむンシデントアプリでP1むンシデントを䜜成し、最初のアラヌトずサポヌトのスクリヌンショットを添付したす。

P1だず振る舞いが速く倉わりたす。むンシデントオヌナヌはバック゚ンドの担圓、デヌタベヌス担圓、サポヌトのリ゚ゟンを招集したす。非必須䜜業は停止し、蚈画枈みのデプロむも止めたす。チヌムは曎新の頻床䟋15分ごずに合意したす。共通の通話が始たっおも、むンシデントの蚘録が唯䞀の真実の堎です。

9:18 AMに「䜕が倉わった」ずいう質問が出たす。タむムラむンには8:57 AMのデプロむが蚘録されおいたすが、䜕がデプロむされたかは曞かれおいたせん。バック゚ンド担圓はずりあえずロヌルバックしたす。゚ラヌは枛少し、再び戻りたす。チヌムはデヌタベヌスを疑い始めたす。

遅延の倚くは予枬できる堎所に珟れたす曖昧な匕き継ぎ「それを芋おいるず思っおた」、文脈の欠劂最近の倉曎、既知のリスク、珟圚の担圓者、チャットやチケット、メヌルに散らばった曎新。

9:41 AMにデヌタベヌス担圓がスケゞュヌルされたゞョブによる暎走ク゚リを発芋したす。ゞョブを無効化し、圱響を受けたサヌビスを再起動しお埩旧を確認。重倧床は監芖のためP2に䞋げられたす。

良いクロヌズずは「盎った」だけではありたせん。きれいな蚘録です分単䜍のタむムラむン、最終的な根本原因、誰がどの決定をしたか、䜕が䞀時停止されたか、オヌナヌず期日付きのフォロヌアップ䜜業。こうしおストレスフルなP1が繰り返しの痛みではなく孊びになりたす。

デヌタモデルそれで足りる最小限の構造

良いむンシデントツヌルは䞻に良いデヌタモデルです。レコヌドがあいたいだず、むンシデントが䜕か、い぀始たったか、䜕が未解決かで議論になりたす。

コアの゚ンティティはITチヌムが既に話しおいる圢に近づけおください

  • Incidentむンシデント 起きた事象のコンテナ
  • Serviceサヌビス ビゞネスが皌働させおいるものAPI、デヌタベヌス、VPN、課金
  • Userナヌザヌ 察応者やステヌクホルダヌ
  • Update曎新 時系列の短いステヌタスノヌト
  • Taskタスク むンシデント䞭および埌の具䜓的䜜業
  • Postmortemポストモヌテム むンシデントに玐づく1぀の報告曞ずアクション項目

埌で混乱を避けるために、むンシデントには垞に埋められる構造化フィヌルドをいく぀か甚意しおください。フリヌテキストは圹立ちたすが、それだけに頌っおはいけたせん。実甚的な最小項目は、明確なタむトル、圱響ナヌザヌが䜕を䜓隓しおいるか、圱響を受けるサヌビス、開始時刻、珟圚のステヌタス、重倧床です。

関係性は䜙蚈なフィヌルドより重芁です。1぀のむンシデントは倚数の曎新ず倚数のタスクを持ち、サヌビスずは倚察倚でリンクしたす障害は耇数システムに圱響するこずが倚いため。ポストモヌテムはむンシデントず1察1にしお、最終的なストヌリヌを1぀にしたす。

䟋"Checkout errors" のむンシデントはサヌビス「Payments API」ず「PostgreSQL」にリンクし、15分ごずの曎新があり、「ロヌルバック」「リトラむガヌド远加」などのタスクがありたす。埌でポストモヌテムに根本原因がたずめられ、長期タスクが䜜られたす。

重倧床レベルず察応目暙

人がストレスを受けおいるずきには、党員が同じ意味で理解できる単玔なラベルが必芁です。P1〜P4を平易な蚀葉で定矩し、重倧床フィヌルドのすぐ暪に定矩を衚瀺しおください。

  • P1重倧 コアサヌビスがダりン、たたはデヌタ損倱の可胜性。倚くのナヌザヌが利甚䞍胜。
  • P2高 䞻芁機胜が壊れおいるが回避策があるか、圱響範囲が限定的。
  • P3䞭 緊急性䜎め、小グルヌプが圱響を受け、ビゞネス圱響は小さい。
  • P4䜎 芋た目や軜埮なバグ、埌回しでよい。

察応目暙はコミットメントのように読めるようにしたす。単玔な基準実情に合わせお調敎

重倧床最初の応答受領最初の曎新曎新頻床
P15分15分30分ごず
P215分30分60分ごず
P34時間1営業日毎日
P42営業日1週間週次

゚スカレヌションルヌルは機械的にしおおくずよいです。P2が曎新頻床を逃したり圱響が拡倧したら、システムが重倧床の再評䟡を促すべきです。混乱を避けるために、重倧床を倉曎できるのは限定された人倚くはむンシデントオヌナヌやむンシデントコマンダヌにし぀぀、誰でもコメントでレビュヌを䟝頌できるようにしたす。

むンパクトマトリクスを甚意するず重倧床を玠早く決められたす。必芁項目ずしお圱響ナヌザヌ数、収益リスク、安党性、コンプラむアンスセキュリティ、回避策の有無を捕捉したす。

ストレス時に人を導くワヌクフロヌ状態

未完成のむンシデントを防ぐ
むンシデントが先に進む前に、所有者・次のアクション・原因を必須にしたす。
ルヌルを远加

むンシデント䞭に人々が必芁なのはオプションの倚さではなく、次に䜕をすべきかが明確になる少数の状態です。

普段うたくいっおいるずきの手順から始め、リストは短く保っおください。状態が6〜7個以䞊になるず、チヌムは文蚀の議論を始めおしたい、本来の問題解決が進みたせん。

実甚的なセット

  • New新芏 アラヌト受信、ただ確認されおいない
  • Acknowledged受領 誰かが所有をセットし、最初の応答を開始
  • Investigating調査䞭 圱響の確認、有力原因の絞り蟌み
  • Mitigating緩和䞭 圱響を枛らすためのアクション実斜䞭
  • Monitoring監芖䞭 サヌビスが安定しおおり再発を監芖
  • Resolved解決 サヌビスが埩旧し、レビュヌ準備完了

各ステヌタスには明確な入出条件を蚭けたす。䟋えば

  • オヌナヌが蚭定され、次のアクションが䞀文で曞かれおいないずAcknowledgedに移せない。
  • 少なくずも1぀の具䜓的な緩和タスクロヌルバック、機胜フラグオフ、キャパシティ远加がないずMitigatingに移せない。

遷移で人が忘れがちなフィヌルドを匷制しおください。䞀般的なルヌル短い根本原因芁玄ず最䜎1件のフォロヌアップがないずむンシデントを閉じられない、ずいう具合です。“RCA: TBD”を蚱すず、そのたた残りがちです。

むンシデントペヌゞは䞀目で次の3぀に答えられるべきです誰が担圓か、次のアクションは䜕か、最埌の曎新はい぀か。

割り圓おず゚スカレヌションルヌル

むンシデントが隒がしいずきに時間を倱う最速の方法は曖昧な所有暩です。アプリは1人を明確に責任者にし぀぀、他の人が手を貞しやすくすべきです。

単玔で有効なパタヌン

  • Primary owner䞻芁オヌナヌ 察応を䞻導し、曎新を投皿し、次の手を決める
  • Helpers支揎者 タスクを匕き受け蚺断、ロヌルバック、広報など、報告する
  • Approver承認者 リスクのある操䜜を承認できるリヌド

割り圓おは明瀺か぀監査可胜にしたす。誰がオヌナヌを蚭定したか、誰が承認したか、以降の倉曎履歎を远跡しおください。“Accepted受諟”は重芁です。誰かを割り圓おおもその人が寝おいたりオフラむンだず実際の所有暩になりたせん。

オンコヌル割り圓おずチヌムベヌス割り圓おは重倧床で䜿い分けるずよいです。P1/P2ではオンコヌルのロヌテヌションをデフォルトにしお必ず名前が぀くようにしたす。䜎い重倧床ではチヌムベヌスで問題ありたせんが、短時間で1人の䞻芁オヌナヌを必須にしおください。

䌑暇や障害を人のプロセスだけでなく仕組みでも扱う蚈画を立おおください。割り圓おられた人が䞍圚蚭定なら、セカンダリのオンコヌルやチヌムリヌドに自動ルヌティングしたす。自動化し぀぀も修正が芋えるようにしおください。

゚スカレヌションは重倧床ず沈黙の䞡方で発火させたす。出発点ずしお有甚な䟋

  • P1 5分以内にオヌナヌ受諟がなければ゚スカレヌション
  • P1/P2 15〜30分で曎新がなければ゚スカレヌション
  • 任意の重倧床 状態が目暙応答時間を超えお"Investigating"のたたなら゚スカレヌション

タむムラむン、曎新、通知

ITのための唯䞀の真実の堎
むンシデント調敎をチャットのスクロヌルから切り離し、単䞀のシステムに移したす。
スプレッドシヌトを眮き換える

良いタむムラむンは共有の蚘憶です。むンシデント䞭は文脈がすぐ倱われたす。適切な瞬間を1カ所に蚘録すれば、匕き継ぎが容易になり、ポストモヌテムは誰かがドキュメントを開く前にほが曞かれた状態になりたす。

タむムラむンが捕らえるべきもの

タむムラむンは意芋を持たせおください。チャットログにしおはいけたせん。倚くのチヌムは怜知、受領、䞻芁な緩和ステップ、埩旧、クロヌズのような少数の゚ントリを頌りにしたす。

各゚ントリにはタむムスタンプ、䜜成者、短い平易な説明が必芁です。遅れお参加した人が5件読めば状況を理解できるべきです。

明確さを保぀曎新タむプ

異なる曎新は異なる察象に向いおいたす。゚ントリにタむプを持たせるず䟿利です内郚メモ生の詳现、顧客向け曎新衚珟を安党にしたもの、決定なぜ遞んだか、匕き継ぎ次の人が知るべきこずなど。

リマむンダヌは個人の奜みではなく重倧床に埓わせたす。タむマヌが鳎ったらたず珟圚のオヌナヌに通知し、それでも繰り返し無芖されれば゚スカレヌションしたす。

通知は察象を絞り、予枬可胜にしたす。䜜成時、重倧床倉曎時、埩旧時、曎新の期限超過時に通知する小さなルヌルセットで十分です。党瀟に毎回通知するのは避けおください。

実際にフォロヌが進むポストモヌテム

むンシデントアプリを玠早く構築
1぀のデヌタモデルからむンシデントキュヌ、むンシデントペヌゞ、ポストモヌテムトラッカヌを構築したす。
AppMasterを詊す

ポストモヌテムには2぀の仕事がありたす平易な蚀葉で䜕が起きたかを説明するこず、そしお同じ故障が再発しにくくするこず。

曞き出しは短くし、アりトプットをアクションに匷制しおください。実甚的な構成は芁玄、顧客圱響、根本原因、実斜した修正、フォロヌアップです。

フォロヌアップが芁点です。段萜で終わらせないでください。各フォロヌアップを担圓者ず期日付きの远跡タスクに倉えおください。たずえ期日が「次のスプリント」でも構いたせん。それが「監芖を改善すべき」から「Alexが金曜日たでにDB接続飜和のアラヌトを远加する」ぞの違いです。

タグは埌でポストモヌテムを有甚にしたす。各むンシデントに1〜3個のテヌマを远加しおください監芖の穎、リリヌス、キャパシティ、プロセスなど。1か月埌には倚くのP1がリリヌス由来かアラヌト䞍足由来かずいった基本的な問いに答えられたす。

蚌拠は添付しやすく、必須にしないでください。スクリヌンショット、ログスニペット、倖郚システムぞの参照チケットID、チャットスレッド、ベンダヌのケヌス番号を任意で添付できるようにしお、軜量に保ち、人が実際に蚘入するようにしたす。

ステップバむステップ1぀の内郚アプリずしおミニシステムを構築する

これはスプレッドシヌトに列を増やしただけのものではなく、小さなプロダクトずしお扱っおください。良いむンシデントアプリは実際に3぀のビュヌで構成されたす今䜕が起きおいるか、次に䜕をするか、そしお埌で䜕を孊ぶか。

プレッシャヌ䞋で人が開く画面をスケッチするこずから始めたす

  • Queueキュヌ フィルタ付きのオヌプンむンシデントOpen、Needs update、Waiting on vendor、Closed
  • Incident pageむンシデントペヌゞ 重倧床、オヌナヌ、珟圚のステヌタス、タむムラむン、タスク、最新の曎新
  • Postmortem pageポストモヌテムペヌゞ 圱響、根本原因、アクションアむテム、担圓者

デヌタモデルず暩限蚭定を同時に䜜っおください。誰でも党郚を線集できるず履歎が乱れたす。䞀般的なアプロヌチはITには広い閲芧暩限、ステヌトや重倧床の倉曎は制埡、察応者は曎新を远加でき、ポストモヌテム承認には明確なオヌナヌがいるこず。

次に半端なむンシデントを防ぐワヌクフロヌルヌルを远加したす。必須フィヌルドは状態に䟝存させたす。"New"ならタむトルず報告者だけでよいが、"Mitigating"には圱響の芁玄を必須にし、"Resolved"には根本原因の芁玄ず最䜎1件のフォロヌアップを必須にする、ずいった具合です。

最埌に過去のむンシデント2〜3件を再珟しおテストしたす。1人がむンシデントコマンダヌ圹、1人がレスポンダヌ圹を挔じたす。どのステヌタスが䞍明瞭か、どのフィヌルドを飛ばすか、どこにデフォルトが必芁かがすぐ芋えおきたす。

よくある倱敗ず回避法

レスポンダヌに明確なキュヌを提䟛
オヌプン、曎新必芁、ベンダヌ埅ちを䞀぀の芋やすいビュヌで衚瀺したす。
ダッシュボヌドを䜜る

倚くのむンシデントシステムが倱敗する理由は単玔ですストレス䞋でルヌルを芚えられない、アプリが埌で必芁な事実を捕らえない。

倱敗1重倧床やステヌタスが倚すぎる

6぀の重倧床や10の状態があるず人は掚枬したす。重倧床は3〜4に抑え、状態は次に䜕をすべきかに集䞭させおください。

倱敗2単䞀オヌナヌがいない

誰もが“芋おいる”だけだず誰もそれを進めたせん。むンシデントが前に進む前に必ず1人の名前付きオヌナヌを芁求し、匕き継ぎは明瀺的にしおください。

倱敗3信頌できないタむムラむン

"い぀䜕が起きたか"がチャット履歎頌みだずポストモヌテムが議論になりたす。開いた、受領、緩和、解決のタむムスタンプを自動取埗し、タむムラむン゚ントリは短く保っおください。

たた曖昧な根本原因メモ"ネットワヌクの問題"で閉じるのは避けおください。明確な根本原因の䞀文ず少なくずも1件の具䜓的な次ステップを芁求したす。

ロヌンチチェックリストず次のステップ

å…šIT組織に展開する前に基本をストレステストしおください。最初の2分で適切なボタンが芋぀からなければ、人はチャットやスプレッドシヌトに戻りたす。

短めのロヌンチチェックに泚力したす圹割ず暩限、明確な重倧床定矩、所有暩の匷制、リマむンダヌルヌル、応答目暙未達時の゚スカレヌション経路。

たずは1チヌムず頻繁にアラヌトが出る数サヌビスでパむロットを行い、2週間運甚しお実際のむンシデントに基づき調敎しおください。

もしスプレッドシヌトや別アプリを぀なぎ合わせずに単䞀の内郚ツヌルずしお構築したければ、AppMaster (appmaster.io) は䞀぀の遞択肢です。デヌタモデル、ワヌクフロヌルヌル、Web/モバむルのむンタヌフェヌスを䞀箇所で䜜れるので、むンシデントキュヌ、むンシデントペヌゞ、ポストモヌテム远跡にうたく合いたす。

よくある質問

What does an internal incident app actually fix that chat and email don’t?

散圚する曎新を1぀の共有レコヌドに眮き換え、次の基本をすばやく答えられるようにしたす誰がむンシデントを担圓しおいるか、ナヌザヌが䜕を経隓しおいるか、䜕が詊されたか、次に䜕をするか。これにより、匕き継ぎで倱う時間、矛盟したメッセヌゞ、芁玄を求める䞭断が枛りたす。

When should we open an incident instead of just investigating quietly?

顧客やビゞネスぞの実害があるず刀断したら、根本原因が䞍明でもむンシデントを立お始めおください。仮のタむトルや「圱響䞍明」ずしお開いおおき、範囲や重倧床が確定したら詳现を詰めおいけばよいです。

What are the minimum fields every incident should have?

小さく構造化しおおくこず明確なタむトル、圱響の芁玄、圱響を受けるサヌビス、開始時刻、珟圚のステヌタス、重倧床、そしお1人のオヌナヌ。状況が進むに぀れお曎新ずタスクを远加したすが、䞻芁な事実をフリヌテキストだけに頌らないでください。

How many severity levels should we use, and how do we define them?

議論にならないように3〜4レベルにたずめ、誰でも理解できる平易な定矩にしたす。デフォルト䟋ずしおは、P1はコアのダりンやデヌタ損倱リスク、P2は回避策のある䞻芁機胜障害、P3は小芏暡な圱響、P4は軜埮・芋た目の問題です。

What response targets (SLA-like timings) are worth tracking in the app?

玄束のように感じられる目暙を蚭定したす応答時間、最初の曎新たでの時間、曎新の頻床。曎新の頻床が守られなければリマむンダヌや゚スカレヌションを起動しおください。むンシデント䞭の“沈黙”が本圓の倱敗であるこずが倚いです。

What incident states should we include so the workflow stays simple?

6぀前埌に抑えたステヌタスを目指したすNew、Acknowledged、Investigating、Mitigating、Monitoring、Resolved。各状態が次に䜕をすべきかを明確にし、ストレス䞋で人が忘れがちな項目を遷移で匷制したす䟋えばAcknowledged前に所有者を必須にするなど。

How do we prevent fuzzy ownership during a noisy outage?

1人のプラむマリオヌナヌを必須にしお、その人が察応を䞻導し、曎新を投皿する責任を持぀ようにしたす。受諟Acceptedを蚘録しお、割り圓おた盞手がオフラむンだず実際の所有暩にならない状況を避けたす。匕き継ぎは蚘録されたむベントにしおください。

What should the timeline include, and what should it avoid?

怜出、承認、䞻芁な決定、緩和ステップ、埩旧、クロヌズを各゚ントリずしお蚘録し、各゚ントリにタむムスタンプず䜜成者を付けたす。チャットの曞き起こしではなく共有の“蚘憶”ずしお扱い、埌から来た人が数件読めば状況を把握できるようにしたす。

What makes a postmortem actually lead to improvements?

短く具䜓的に䜕が起きたか、顧客ぞの圱響、根本原因、緩和䞭に行った倉曎、そしおオヌナヌず期限付きのフォロヌアップ項目。曞かれた文章も重芁ですが、同じ倱敗を防ぐのは远跡されたタスクです。

Can we build this as one internal tool without stitching together multiple systems?

はい。むンシデント、曎新、タスク、サヌビス、ポストモヌテムを実際のデヌタずしおモデル化し、アプリ内でワヌクフロヌルヌルを適甚すれば可胜です。AppMasterでは、デヌタモデル、ワヌクフロヌ、Web/モバむル画面を䞀箇所で䜜れるので、プレッシャヌ䞋でスプレッドシヌトに戻るリスクを枛らせたす。

始めやすい
䜕かを䜜成する 玠晎らしい

無料プランで AppMaster を詊しおみおください。
準備が敎ったら、適切なサブスクリプションを遞択できたす。

始める
ITチヌム向けむンシデント管理アプリワヌクフロヌからポストモヌテムたで | AppMaster