無窮ナレッジ

▼"自作"スーパーコンピュータ製作秘話

http://www.itmedia.co.jp/news/articles/0404/13/news028.html 
>70分後、計算の75%を達成したところで、スーパーコンピュータは1つのノードの
>不具合によって崩壊した。
 
要は信頼性の問題だな。
 
以下、 http://wwwsoc.nii.ac.jp/jps/jps/butsuri/zadankai9701.html  より。
 
>梅木:計算機の能力っていうのは,今後同じように伸びるとお考えですか?
 
>何:一番の問題はコストです.ベクトルプロセッサーは専用的に開発するので高く
>つきます.そこで,並列機のように低コストのプロセッサーを沢山そろえ,
>cost performanceを良くする方向に流れています.計算パワーを更に追い求めると,
>ベクトル並列機が考えられるので,再びコストの問題が生じるのではと思います.
 
>梅木:並列をどんどん増やしていくと,プロセッサー間のデータの流れとかで.
 
>何:通信のconflictionが起こり,大体1,000台規模が限界かと感じます.
 
>梅木:1,000台以上はだめかもしれない?
 
>何:個人的な見解ですが,1,000台オーダーのイメージを持ってます.
 
>伊藤:1,000台の壁っていうのは,コミュニケーションとかそんな難しいことじゃなく
>て,信頼性からくるんじゃないですか.1台のコンピュータがこれから1年間にエラーを
>起こす確率をpだとすると,1,000台のシステムは (1−p)^1000 でしかsurviveしない
>わけでしょう.
 
>梅木:でも256とかありますよ.
 
>伊藤:その辺が限界だと思います.それを越えたらもう,always downという感じ
>だと思います.コンピュータでは,システムの方の信頼性も大事じゃないですか.
>当面,1,000台が限界,で正しい読みだと思うのです.
 
>梅木:1台壊れても,他のが補ってくれるような,何か.
 
>伊藤:複雑にすればするほど,また信頼性が劣りますからね.
 
関連:
(信頼性問題の鉄則「鎖はもっとも弱い輪よりも弱い」)
http://mkynet.hp.infoseek.co.jp/webcic/lib/inw2/inw_0311152.html#5 
−移転→  http://takagi1.net/g-sys/inw2/5_inw_0311152.html 
−移転→  https://takagi1.net/webcic/lib/inw2/inw_0311152.html#5