My online activities
検索
以前の記事
2013年 02月 2013年 01月 2012年 03月 2012年 02月 2012年 01月 2011年 12月 2011年 11月 2011年 10月 2011年 09月 2011年 08月 2011年 07月 2011年 06月 2011年 05月 2011年 02月 2011年 01月 2010年 12月 2010年 11月 2010年 10月 2010年 09月 2010年 08月 2010年 07月 2010年 06月 2010年 05月 2010年 04月 2010年 03月 2010年 02月 2010年 01月 2009年 12月 2009年 11月 2009年 10月 2009年 09月 2009年 08月 2009年 07月 2009年 06月 2009年 05月 2009年 04月 2009年 03月 2009年 02月 2009年 01月 2008年 12月 2008年 11月 2008年 10月 2008年 09月 2008年 08月 2008年 07月 2008年 06月 2008年 05月 2008年 04月 2008年 03月 2008年 02月 2008年 01月 2007年 12月 2007年 11月 2007年 10月 2007年 09月 2007年 08月 2007年 07月 2007年 06月 2007年 05月 2007年 04月 2007年 03月 2007年 02月 2007年 01月 2006年 12月 2006年 11月 2006年 10月 2006年 09月 2006年 08月 2006年 07月 2006年 06月 2006年 05月 2006年 04月 2006年 03月 2006年 02月 2006年 01月 2005年 12月 2005年 11月 2005年 10月 2005年 09月 2005年 08月 2005年 07月 2005年 06月 2005年 05月 2005年 04月 2005年 03月 2005年 02月 2005年 01月 2004年 12月 2004年 11月 2004年 10月 2004年 09月 2004年 08月 2004年 07月 2001年 01月 カテゴリ
全体 Math Science Book Log Misc Business Music IT Food Topic Movie Art Stat Politics Muttering Off Topic 未分類 ブログパーツ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧
|
2007年 12月 02日
![]() その数学が戦略を決める 超巨大データの多変量解析、データマイニング、機械学習を新しい用語"Super Crunching"と名付け、その"Super Crunching"の成功事例紹介とその分野をプロパガンダする本。うーん、ビミョウ。 まず良い点から。 データマイニングの成功例が次から次へと文献付きで紹介される。もちろん、それらの成功例は既存の「勘と経験」に頼る専門家をはるかに凌駕するものとして描かれる。読み物としてはそれなりに面白い。 著者が目指している態度、すなわち「勘と経験」だけに頼るのではなく、科学的な(特に統計学的な)根拠にも頼ろうとエバンジェリングしている点は、全く同意する。むしろ著者はその立ち位置から、過度に科学的な根拠を強調しすぎているかも。 そしてビミョウな点。 紹介されている多変量解析の手法は、回帰分析、因子分析、ブートストラップを用いたクラスター分析、ニューラルネットを用いた回帰分析と判別分析、t検定、ベイズ検定等なのだが、とにかく統計手法の提示方法がオーガナイズされていないことこの上ない。回帰分析の話をしているとおもったら、次の例では因子分析に話を移したりと、ミソもくそも"Super Crunching"にしてしまっている。 すべての統計手法には限界がある。その限界を示しながら控えめに成功例を提示するのが、学者としての嗜みだと思うのだが、その適用限界の提示があまりに控えめかつ少なすぎて、"Super Crunching"やればすぐに解決さ!ってな話題が多すぎだ。そんなことあり得ない。ちょっと宣伝臭がしすぎ。 この本は華々しいことばかり書きすぎで、都合の悪いことはほとんど書いていない。冒頭のワインの質を回帰分析したOrley Ashenfelterの話にしても、自分の大学の同僚だからなのか、いいことしか書いていないばかりか、「勘と経験」のRobert Parkerを揶揄さえしている。真実は、統計学者の間からも彼の統計的分析手法に批判がでていて、Orley Ashenfelterの式はたまたま1990年付近の予測があたっただけだというのが常識になっているのに。 普通の真っ当な専門家だったら、データが巨大になればなるほど、どうやって信頼できるデータをトリアッジし、どの分析手法を採用したらよいか、そしてどのようなパラメータを使ってモデリングしたらよいか、という悩みがつきないものだ。そもそも"Super Crunching"であっても、それらの解析モデリングをする部分は「勘と経験」によるものだ。だから、もう少しデータ解析を根拠にしてもいいんじゃないかという主張はできるが、単純に"Super Crunching"対「直感・経験主義」で"Super Crunching"の圧勝!なんて自信に満ちたバカな主張はちょっとできないはずだ。 Freakonomicsは、その著者の一人であるSteven Levittの業績が中心でオリジナリティに溢れていたし、ライターがプロの編集者だったのでリーダビリティに富んでいた。その二匹目のドジョウをねらったのが、Levittとの共同研究もあるこの著者なのだが、そいつは見事に失敗していると思う。なにせ自分の仕事はちょっとだけで、あとは他人の事例である。オリジナリティが少なすぎる。しかも、欲情との結託とも言うべき、テレビ風の単純な議論の提示方法でうんざりする。"Super Crunching"対「直感・経験主義」だとか、Super Crunchingへの抵抗勢力云々だとか、データ主義がもたらす暗い未来だとか。こんな提示方法ならば、いっそのことジャーナリストに代筆してもらえばよかったのに。 最後に、個人的に邦訳との相性が合わない。まず、編集者の選んだそうである邦題タイトルは、ちょっとワケがわからない。なぜこんなタイトルをつけたのか、この本のどこにそんなことが書いてあったのかという点で疑問だらけだ。邦題タイトルの「その数学」とは多変量解析のことか? また、Super Crunchersを「絶対計算者たち」と訳したり、false positiveを「偽陽性」としたりと、テクニカルタームの訳がおかしいと思う。Super CrunchersだとかSuper CrunchingのSuperには「絶対」をあてるのはどうしたって変だ。絶対値を計算するわけでも、囲碁の戦略を語るわけでもないのだから。絶対計算とするならば、相対計算って何よってな具合になってワケがわからない。Super Crunchingは、意味的には超大規模多変量解析だとか超巨大データの統計分析なのだから、その通りに素直に訳せば良かったのに。また、false positiveは医学用語では確かに「偽陽性」という用語はあるが、これは統計学のタイプ1エラーのことなんだから単純に「誤検知」とするべきだ。他にも統計学用語にビミョウな訳語が多くていちいち引っかかる。それに加えて、あまりに直訳なので読みにくい。基本的には他の分野の山形さんの訳は大好きなのだが、自分の専門に近いと、誤訳とまでは行かないが無性に耐えられないのが不思議だ。どうも訳者がその分野のコンテキストを共有していないために、読み手側にミスマッチを引き起こすみたいだ。 総じるとこの本は著者のマーケティングツール+データマイニングサクセスストーリーに他ならない。読み物としてはそれなりに悪くないとは思うので、過剰に"Super Crunching"の効力を信じない限りにおいて、時間があるなら読んでも損はないんじゃないかと思う。
by yutakashino
| 2007-12-02 00:13
| Book
|
ファン申請 |
||