情報処理技術者試験☆合格への道

ライフワークとしての資格取得ブログ presented by Pman






Since 2005/01/10

ブログ内検索↓

カテゴリー


ブログランキング

にほんブログ村 資格ブログ 国家試験へ にほんブログ村 資格ブログ IT系資格へ
 にほんブログ村 資格ブログへ
 ブログの殿堂
資格・スキルアップ Ranking  ナレコム おけいこブログランキング

アンケート


広告エリア1




参加トラコミュ


SEO/サイト価格

SEO対策・SEOとは
IT  資格  ブログ
受験  日記  合格  論文


最近の記事


リンク集




自己紹介など

    くつろぐ

  • ニックネーム:Pman
  • プロフィール:
     情報処理サービス会社に勤務。主に金融業のソフトウェア開発、システム運用・保守を担当。メインフレームからオープン系まで広く浅く経験。資格取得はライフワークとなりつつある。
    保有資格
    システム監査技術者
    プロジェクトマネージャ
    アプリケーションエンジニア
    テクニカルエンジニア(システム管理)
    ネットワークスペシャリスト
    情報処理技術者(一種、二種)
    電気通信主任技術者(第一種伝送交換)
    工事担任者(デジタル第1種)


  •  質問、要望、感想、応援などは
     下のメールフォームから、直接
     私あてに送ることができます。


     当ブログはリンクフリーですが、
     リンクした場合は、メール又は
     コメントで知らせていただくと
     ありがたいです。

メールフォーム

名前:
メール:
件名:
本文:

広告エリア2












スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

SM合格時の再現論文

平成17年度 春期 テクニカルエンジニア(システム管理)

【午後2 問題文】

問1 システム障害の再発防止策について

 今日では、情報システムの障害発生が、企業や官公庁の基幹業務に多大な影響を与える可能性が高くなっている。このような状況を踏まえて、障害発生時には、まず障害からの迅速な復旧を図る。その後、発生した障害の根本原因を究明し、再発防止策を検討して実施することが重要である。
 システム管理エンジニアとしては、運用上の仕組み、運用手順、関係者間の情報伝達方法など、システム運用面からの再発防止策を講じる必要がある。例えば、システムを確実に運用するために、運用手順の作成時に、同様なシステム運用の経験をもつエンジニアに参加してもらいレビューを行うことや、作業結果を確実に確認するために、目視確認からツールによる自動確認に変更することなどが考えられる。
 システム運用面からの再発防止策は、次の手順に従って関係者と協議し、実施が決定される。
 (1) 障害発生時に特定された直接的な原因の背景にある根本原因を究明する。
 (2) 根本原因を取り除くための対策案を、システム運用面から幾つか列挙する。
 (3) 列挙された対策案に対し、費用対効果、体制面などから採否を決定する。
 あなたの経験に基づいて、設問ア~ウに従って論述せよ。

設問ア
 あなたが携わった情報システムの概要と、発生したシステム障害の概要及び業務への影響について、800字以内で述べよ。
設問イ 
 設問アで述べた障害に対し、究明された障害発生の根本原因は何か。また、その根本原因を取り除くために検討した、システム運用面からの再発防止策は何か。さらに、それらの採否をどのように決定したか。工夫した点を中心に、具体的に述べよ。
設問ウ
 設問イで述べた再発防止策について、どのように評価しているか。今後の課題は何か。それぞれ簡潔に述べよ。


【再現論文 Pman wrote】

1.システム概要及び発生した障害
1-1.私が携わった情報システムの概要
 首都圏を中心に約200支店を有する金融機関(以下、ユーザと呼ぶ)は、個人向け住宅ローンを主力商品の1つとしている。ユーザ業務は、6年前に稼働開始した住宅ローン情報管理システムにより運営されている。当システムの開発・運用は、情報処理サービス会社J社がアウトソーシングの形で受託しており、J社に勤務する私はシステム管理者として保守・運用に携わってきた。
 当システムは、J社に設置される汎用コンピュータ上のデータベース(以下、DBと呼ぶ)に対し、公衆回線を経由して、各支店の専用端末からアクセスする集中処理方式である。運用時間は、平日9時から17時までをオンライン時間帯、同17時から20時頃までをバッチ処理時間帯としている。
1-2.発生したシステム障害
 稼働開始から2年程たった頃、オンライン時間中にあるユーザ支店の端末で、システムの異常終了が発生した。私はまず、障害事象を正確に把握するため、ユーザ窓口の担当者に状況を確認したところ、経理業務中にある顧客データのDB更新処理で、突然エラーメッセージが表示され更新不可になったという事象であった。次にJ社内部でダンプリスト取得により障害の原因を調査したところ、該当データのDB不整合のためアプリケーションエラーでアベンドしていたことが判明した。
1-3.ユーザ業務への影響
 経理業務は、月単位で締め処理を行う期間が決まっている。この処理は、ローン残高の集計など企業経営に関わる重要な事務処理であるため、システム障害による業務の停止は避けなければならない。私は、早急に障害対策を講じる必要があると考えた。

2.システム障害の再発防止策について(設問イ)
2-1.障害発生の根本原因
 障害発生の当日、ほかに13支店で同じように異常終了が発生した。このことから、特定の顧客データに何らかの異常が起きたのではないかと私は推測した。調査の結果、前日の夜間におけるDBパッチ作業のミスが判明した。DBパッチとは、ユーザからの依頼により、J社において特定のデータを強制的に塗り変える例外作業で、ユーティリティを用いた手作業である。ところが、本来パッチを当てるべきデータとは異なるデータに対し誤ってパッチを当てたため、DB不整合が発生したものであった。こうした作業ミスを引き起こすような運用方法に、障害の根本原因が潜んでいたと私は認識した。
2-2.システム運用面からの対策案
 以上の根本原因を取り除くための対策案を列挙する。
案(1) 作業要員の増強
 DBパッチ作業を実施するのは週1~2日、夜間バッチ処理後の2時間程度であったため、当初、作業担当者は1名で十分と考えていた。しかし、今回のシステム障害は、担当者のケアレスミスを防止または発見できなかったことに原因がある。また、顧客データを更新するという重要な作業を一人で行うことは、J社にとってリスクが高いと考えられる。そこで私は、作業要員を2名に増強し、パッチ作業時にダブルチェックを行い、ミスがないかどうかの検証を強化することを考案した。
案(2) 運用手順書の見直し
 運用記録の証跡書類を見ると、通常の運用作業における手順はほぼ確立されていたが、DBパッチ作業等の例外運用については確立されていなかった。例外運用の手順書は、ユーティリティの操作方法や障害発生時の対処方法が中心であり、J社の責任範囲や作業の承認ルールが不明確であった。今回のシステム障害は、パッチ作業における承認者及び確認者が曖昧であるなど、手続上の不備があったことに起因する。このため私は、運用手順書を全面的に見直し、改版することを考案した。
案(3) 検証ツールの導入
 パッチ対象のデータ件数が大きいほど、今回のような障害発生による影響も大きくなる。そこで、今までは作業結果をDBダンプリストの取得による目視確認としていたが、検証ツールによる自動確認に変更することを考案した。ツールは表計算ソフトのマクロ機能を利用したものであり、確認作業の省力化が期待できる。
2-3.対策案の採否の決定方法
 まず案(1)については、ダブルチェックの効果がある反面、作業時間が深夜に及ぶこともあるため、要員の工数確保が難しかった。体制面を変更するにはユーザからの承認が必要であったが、私の提案に対し、ユーザ側は「1名で十分」との見解を示した。確かに、発生確率の低い障害に対して体制面を強化するのは非効率である。このため私は案(1)を不採用とした。案(2)については、J社の各関係者に対しヒアリングを行ったところ、安定運用のために手順書は整備すべきとの意見が多かった。加えて、DBパッチ作業は一時的なものでなく、今後も継続する見通しであることを勘案し、私は、運用手順書を改版することに決定した(採用した)。案(3)については、ツールの開発工数・費用が膨らむことを懸念したが、必要性の高いチェック機能に絞り込むことで費用を抑えられる。さらに、ツールの入力となるチェック用データをユーザ側で作成して頂けるなど協力体制が得られたことから、私は案(3)を採用した。

3.評価及び課題(設問ウ)
3-1.評価
 運用手順書の見直しにより、DBパッチ作業時の承認~実施~検証の流れが明確になり、例外運用でありながら実際には定型的な業務として標準化することができた。また、検証ツールの導入により、パッチ作業時間が従来より30%短縮するなど、省力化及び効率化を図ることができた。これらの対策により、障害の再発防止ができていることから、私の実施した活動は全体的に効果があったと評価する。
3-2.今後の課題
 システム障害の再発防止策を検討して実施した結果、運用手順に関しては、改善すべき点が残っていると感じた。なぜなら、手順書の一部の項目については、運用環境の変化により形骸化したり、実態とかけ離れている部分もあったからである。したがって、今後も継続的に運用手順の有効性や妥当性を確認していく必要があろう。

以上

関連記事
スポンサーサイト

コメント

コメントの投稿



管理者にだけ表示を許可する

トラックバック

http://smpman.blog3.fc2.com/tb.php/126-d7139553

 | HOME |  ▲ page top


上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。