2021年12月30日

京都大学のスーパーコンピュータのデータ77TBが消失 うち28TBがバックアップ無く復元不能 バックアップ中にプログラム更新したため

■京都大学のスーパーコンピュータのデータ77TBが消失 うち28TBがバックアップ無く復元不能 バックアップ中にプログラム更新したため★3 [スペル魔★](5ちゃんねる)

引用ここから〜〜〜〜〜〜〜〜
1 スペル魔 ★ ▼ 2021/12/30(木) 10:50:36.43 ID:MibzjXU69
https://www.itmedia.co.jp/news/spv/2112/29/news040.html

 京都大学は12月28日、同学のスーパーコンピュータに保存していたデータ約77TBが消失したと発表した。うち約28TBはバックアップがなく復元不能という。原因は日本ヒューレット・パッカード(HPE)製バックアッププログラムの不具合で、同社は「100%弊社の責」と謝罪している。

https://image.itmedia.co.jp/news/articles/2112/29/mt1626333_FTVGYBUHN-01.jpg
京都大学のスーパーコンピュータ
 消失したのは、12月3日以降に更新がなかった3401万1293個のファイル。HPEによると、ストレージのバックアップ処理実行中にバックアッププログラムの更新作業をしたことで、ストレージ内のファイルを削除する想定外の処理が発生したのが原因という。

https://image.itmedia.co.jp/news/articles/2112/29/mt1626333_FTVGYBUHN-02.jpg
HPEの説明
 京都大学とHPEはバップアップ作業を停止。プログラムの改善と再発防止策を施した上で1月末までに再始動する予定。HPEは苦情や善後策の相談などを受け付けるメール窓口を設置した。


 京都大学は今後、バックアップ機能の強化と運用管理の改善に取り組む。HPEは「担当技術者へのヒューマンエラーや危険予知・予防に関する再教育を実施する」としている。




5 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 10:52:55.84 ID:uohkmr+X0
だから手順書作って二人で指差し声出し確認しろとあれほど・・・


6 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 10:53:09.94 ID:IkonoUR40
>日本ヒューレット・パッカード(HPE)

Eはどっから発生してんの?つーか、日本ヒューレット・パッカードならJHPだろ


25 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:02:31.83 ID:Dyz0Gww00
>>6
ヒューレット・パッカードが分割してできたうちの一つがヒューレット・パッカードエンタープライズで、その日本法人が日本ヒューレット・パッカード


7 : ニューノーマルの名無しさん age ▼ 2021/12/30(木) 10:54:18.11 ID:PlqrFSTW0
( ^ω^)ネット上のデータ全て一回消して欲しいわお
( ^ω^)消えたい


11 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 10:55:46.22 ID:MTwIIvoe0
>>1
> 復元不能
断片も無理なのか
あとは、世代管理でどこまで無事かにかかっているな。


14 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 10:58:11.33 ID:AnQEqhXa0
ノーベル賞級のデータが消えちゃったりしてるのかな


15 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 10:58:47.48 ID:JvAfGiOf0
テヘペロ


16 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 10:59:21.26 ID:wjYhkuql0
データ蓄積過程で随時小分けしかつ幾つもバックアップを取るもの。28TBなんて個人でも安く保存できるレベル。


18 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:00:41.09 ID:R186jYEM0
待つことができない人が原因か


27 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:03:18.64 ID:icCT5wUR0
iPS関連のデータとか大丈夫なんか


29 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:03:48.18 ID:ltAVZMcl0
まあ消えちゃったものは仕方ないよ??


42 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:09:32.67 ID:PLu5XCUG0
なんのデータが消えたのかどこも書いてない


47 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:11:49.60 ID:tYFnVVxe0
>>42
研究室の出入口の24時間監視カメラ画像3年分とかじゃないのか
案外


43 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:10:45.38 ID:x8ZtnkVy0
中身次第だが関係者だったら発狂してるかも


51 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:12:07.90 ID:1vWP6xrg0
こういうバックアップて前のバックアップに上書きすんの?









57 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:15:45.80 ID:pJ4cwU5y0
プログラマーだけどbashのこの仕様は初めて知ったわ
bashじゃなくてスクリプト言語なら全部こうなのかもしれないけどさ
実行時点で全部メモリに載せるのかと思ってたわ


74 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:24:19.43 ID:TQrpYxeJ0
>>57
ここまでで起きたことを理解してそうなレスがこれしかないの怖すぎる


115 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:45:05.11 ID:5buCh4740
>>57
まぁ、仕様を勘違いしてたにしても対象スクリプト実行中にわざわざリリースしなくても、という気はするけどね
バックアップのスケジュールすらも把握してなかったのかね


58 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:15:55.98 ID:i6Wi2dHr0
わざとだろ。


59 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:16:08.31 ID:Y6CzUf6k0
大事なデータのバックアップがただのシェルスクリプト?でテストも書いてねえの
超ヤバくね

linterも使わず、レビューもテストもしてないんだろ?
起きるべくして起きた事故だ


72 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:22:23.85 ID:WO+R4Dnp0
>>59
作業手順書では、どうなってたんだろう?


63 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:17:13.63 ID:gqxTgweI0
うちも録画した動画28寺以上あるけど、見ないと思うw


73 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:23:58.17 ID:2vrN15zP0
これは酷い‥


77 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:25:04.25 ID:0d7murtb0
どんなに高性能なデバイスがあっても
使う人間がポンコツなら、

と言うお話でした


85 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:29:33.71 ID:Tbuue3T/0
トリプルチェックを取り入れるべき

1人目は「俺がチェックしなくても後の2人がやってくれるだろう」

2人目は「1人目がチェックしてるし俺の後にもチェックがあるから
大丈夫なはず」

3人目は「すでに2人のチェックが入っているんだから問題ないはず」

という感じの完璧なチェック体制


93 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:34:10.15 ID:rBZR6Nud0
え?
クラウドでミラーリングとかしないの?
重要データなら尚更だわ









94 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:34:29.16 ID:TQrpYxeJ0
スクリプト的には
・旧版スクリプトにset -uしてあれば防げた
手順的には
・バックアップスクリプトが動作していない時間に作業実施とすれば防げた
・やむを得ず当該の時間帯にしか実施できないとしてもスクリプトを停止してから作業実施すれば防げた
・リリース手順として旧版スクリプトを退避した上で新版スクリプトを配置とすれば防げた

他にもあるかもしれんがこれ全部踏み抜いたの結構すごいことだと思う


99 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:36:38.00 ID:WO+R4Dnp0
>>93
ミラーでは防げない

>>94
bash


107 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:39:35.70 ID:CQj+sRAn0
普通はバックアップを終えてから作業するんじゃないの?
会社でその手の作業がある時にはみんなが個々に必要な分をバックアップしてるわ


111 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:41:40.21 ID:7dAw+T9I0
バックアップ中に更新作業すんなよw


112 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:42:03.59 ID:k7BUurJg0
ふっかつのじゅもんがちがいます


114 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:42:36.85 ID:+cUdaZ5A0
俺の情報もちゃんと消失してくれたかな(最初から無い)


141 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 11:57:43.91 ID:a7TafLAo0
バックアップ用のハードの費用ケチったからだろ
重要なデータなら定期的に完全なバックアップを永久保存しとけ


143 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 11:59:09.92 ID:5w4xD4kJ0
1ヶ月に一回くらいは完全なバックアップをとって完全に切り離したりしないもんかね?
マジで大切なデータなら1年に一回にバックアップ取って何かあったときのために別の場所で保管するとか


145 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:00:20.26 ID:WO+R4Dnp0
>>143
一応

先月分を失ったわけでは無い









151 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:02:53.34 ID:qutLGkAZ0
他人事だし適当に話しているけど
個人なら複数のコピーをバックアップソフトで自動化でしょ


162 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 12:07:11.48 ID:+4jMfWvt0
普通、定期的にフルバックアップ取るだろ
3週間前のデータ復旧不可とかバカ過ぎて
システム軽んじたツケだな


168 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:09:23.52 ID:a7TafLAo0
>「担当技術者へのヒューマンエラーや危険予知・予防に関する再教育を実施する」
これじゃダメだろ
ヒューマンエラーは起きる前提でシステムを組まないと意味ない
意図的に消そうと思っても消せないくらいのバックアップじゃないとダメ


169 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 12:09:32.32 ID:0ihrBDHL0
ヨシ!d(=゚ω゚=)


171 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:09:57.26 ID:FQ98s0K10
知ったかがそれらしい用語使って的はずれなことを書くスレw


179 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:14:08.18 ID:aP4JJGphO
知らんけど、アドミニみたいな権限で実行してるわけ?


186 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 12:16:54.38 ID:5buCh4740
>>179
バックアップ処理って色んなパーミションのファイル扱うからね


183 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:16:10.71 ID:e/JnSacR0
まあ、まともな研究者なら大事なデータは自分でも保管してるから
問題ないだろ
 
そうだよな、詳しい奴


197 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 12:22:33.28 ID:i6DOahU10
容量:24PB
消失:77TB(復元不能:28TB)


199 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 12:23:01.18 ID:U1xCDxxc0
初歩的なミスすんなよ


305 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 13:42:47.96 ID:2Ootph9f0
>HPEによると、ストレージのバックアップ処理実行中にバックアッププログラムの更新作業をした

バックアップのジョブのスケジュールを確認せずにスクリプト実行中にスクリプトを上書きするなんてあり得ない
こんな杜撰なリリースは今時めずらしい


332 : ニューノーマルの名無しさん ▼ 2021/12/30(木) 14:54:16.42 ID:zOW0brlP0
単なるパフォーマンスアップのためのリファクタリングだったら、発案者が最終的に「余計な事言い出したやつ」扱いで責められるんやろな


348 : ニューノーマルの名無しさん sage ▼ 2021/12/30(木) 15:33:57.43 ID:ZXv7G1Om0
システム屋が百パーセント弊社の責っていうってよほどのことだよね
俺は今まで聞いたことがない

〜〜〜〜〜〜〜〜引用ここまで





posted by nandemoarinsu at 17:17 | Comment(0) | 国内ニュース

この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

人気記事