TS部の仕事 —インフラ サーバ運用とかDRとか—

無断転載禁止 TS部の仕事 —インフラ サーバ運用とかDRとか—

前回、同期のsadakataがTS部(ITインフラとは?)についてわかりやすーく書いてくれました。
はじめまして、prophetのインフラエンジニア集団「TS部」です。

ここからはTS部の人達が実際にどんな仕事をしているかを紹介していきます。
まずは私入社6年目のmiuraが携わっている仕事についてつらつらと書いていきます。

1.サーバ運用について

サーバ運用とは

ITインフラの中でも、「構築」・「運用」と分けられますが、
私はお客様先の会社に常駐し、OS・サーバの運用という仕事に携わっております。

かいつまんで言うと、24時間365日OS・サーバを守る仕事をしています。

OS・サーバを守る

ここでいう守るとは、「サーバの継続的な安定稼働」ための一切の業務のことを指します。
例えば、

・サーバ上にエラーログが出力されていれば原因調査・復旧作業を行ったり、
・お客様の要望に合わせ、設定変更計画の立案・実施をしたり、
・チーム内で「運用」の効率化を図るために、ナレッジ(知識)の蓄積・共有や、
手順のマニュアル化を行うことも重要な業務だったり。

server-room-1376349_1920

コンピュータやお客様に振り回されることも多いですが、
現在より更に良い運用にしていくことが、サーバ運用エンジニアの役割でもあります。

2.仕事内容

DR(ディザスタリカバリ)について

突然ですが、お客様からお預かりしている重要な基幹システムが災害(大規模地震・火災・停電・テロなど)
によって停止(もしくは長期間サービスレベルが低下)してしまったら企業はどうなるのでしょうか。

企業にとって大切なデータが失われ、有事の際に復旧手順が確立されていなければ
その損失は計り知れません!

こうした災害が必ず起こりえるものと想定し、本当に被災した際は
被害を受けたシステムを迅速に復旧・修復させ、事業継続に必要な体制を整えることを「DR」と呼びます。

ディザスタリカバリ(英語:disaster recovery)とは、事業継続マネジメントにおける概念のひとつで、災害などによる被害からの回復措置、あるいは被害を最小限に抑えるための予防措置のことである。主にコンピュータシステムやネットワークなどIT関連で用いられることが多い。

事の発端

なぜこんな業務が存在するかというと
阪神淡路大震災や米国同時多発テロ事件、東日本大震災という大規模災害がきっかけという記事を多く見かけます。

同時多発テロではあれほどの大惨事にも関わらず、多くの金融機関が1週間後にはデータが復旧し、
サービスが稼働することができたそうです。
そこには、周到なバックアップ体制が取れており、
ビジネスの継続性を維持する考えが大きかったからこそ、1週間でサービスが稼働できたのです。

今の仕事も、お客様先のシステムが東日本大震災発生からDRの見直し・体制が整われ、
そんなこんなで、「DR」の要員として関西でサーバ運用の業務を行っております。

サーバ運用としての業務に加え、運用者・システム利用者全員で定期的に災害を想定した訓練を実施し、
改善プロセスを繰り返し、日々の業務改善を行っています。

 

3.仕事終わりは。。。

運用という業務は、原則X時~X時まで対応しますよ!という運用時間が定められているため、
定時外に依頼された仕事やシステムトラブルを除けば、定時で帰社することができます。

なので、帰社後は飲みにいくことも欠かせない!
適度なライフバランスを保つためにオマールエビを喰らいながら、
また明日に向けて英気を養っていくのでした。。。

1463656808451

まだまだこれからもTS部のお仕事について定期的に更新していきますので、
楽しみにしてください!