|
ネームカード
My online activities
検索
最新のコメント
最新のトラックバック
以前の記事
2009年 11月
2009年 10月 2009年 09月 2009年 08月 2009年 07月 2009年 06月 2009年 05月 2009年 04月 2009年 03月 2009年 02月 2009年 01月 2008年 12月 2008年 11月 2008年 10月 2008年 09月 2008年 08月 2008年 07月 2008年 06月 2008年 05月 2008年 04月 2008年 03月 2008年 02月 2008年 01月 2007年 12月 2007年 11月 2007年 10月 2007年 09月 2007年 08月 2007年 07月 2007年 06月 2007年 05月 2007年 04月 2007年 03月 2007年 02月 2007年 01月 2006年 12月 2006年 11月 2006年 10月 2006年 09月 2006年 08月 2006年 07月 2006年 06月 2006年 05月 2006年 04月 2006年 03月 2006年 02月 2006年 01月 2005年 12月 2005年 11月 2005年 10月 2005年 09月 2005年 08月 2005年 07月 2005年 06月 2005年 05月 2005年 04月 2005年 03月 2005年 02月 2005年 01月 2004年 12月 2004年 11月 2004年 10月 2004年 09月 2004年 08月 2004年 07月 2001年 01月 カテゴリ
つぶろぐ
|
2008年 05月 21日
![]() これは西村さんからTwitterで教えてもらったことなのであるが、AWS+Hadoopの幸せな成功例である: Self-service, Prorated Super Computing Fun! NY Timesが過去のアーカイブを含めてすべて無料化したわけだが、そのシステム的な移行措置として過去のスキャンしたTIFF画像をPDFに変換する必要があったのだ。TIFFのサイズは合わせて4TBという巨大さ。 これを行うのに次の構成をとったそうだ:PDF変換にiTextを用いる。変換するマシンはAWS上の100インスタンスをHadoopでMapReduce構成をとることで並列化した。これによりすべてのPDF変換(なんと成果物は1.5TB)が、24時間未満の時間で終了したのだ。そして作業をしたのは、一人のプログラマだけである。 だから言ったでしょ。もう時代は一人大規模サービスの時代なんですよ。そのためのインフラはちょっと工夫すれば、もう個人の手に入るんですよ。だからこそ、GoogleよりもAmazonのほうが革命的なのだ。 上記のサイズのジョブだと設定含めて36時間回したとして、AWSの課金では$600-$700ですよ。4TBのTIFFのPDF変換なんて、業者に頼んだらいくらになるか想像がつかない。ちょっと大ざっぱな計算をしてみよう。ソースは1ページ10MBとして400,000ページ。いまここを見ると、TIFF->PDF変換の変換料が1ページ150円だそう。だから、400,000ページで60,000,000円、つまり変換料になんと6千万円。まあ、実際はバルク料金になるだろうから、6千万なんて金額にはならずに500万円以下くらいでやってくれると思う。でも、一方でAWS60,000円+人件費(おそらく2日くらいか、120,000円) = 18万円なり。 どうですか、もうこういう世の中なのですよ。 ※このブログはトラックバック承認制を適用しています。ブログの持ち主が承認するまでトラックバックは表示されません。
| ||||||||||||||||||||||||||||||