ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

データの分析をタダで引き受けてはならない10の理由

 

それなりの分析屋であれば誰もが経験があることでしょう。データを扱えない人から、データを扱える人と思われるために、分析の依頼をされることが。それも軽い気持ちから始まるタダ(無償、無料)の場合が。

 

そう呼ばれたくない実務者が多いのに、それを叫ぶ組織が多いという不思議な昨今のデータサイエンティストの流行はそろそろ終わってほしいのですが、データの分析という行為自体はいつの時代も不滅です。

 

私も企業や大学、知人や家族などからデータの分析を頼まれることがよくあります。もうしょっちゅうです。もちろんネットや金融やらのビッグデータに限ることではありません。だいたい相手は私が本業でやっているニッチな統計処理なんて理解していません。ただ、なんとなく、あいつに聞けばいいみたいな風に思っているだけでしょう。それはEXCELの使い方から、簡単な統計処理の説明といった参考書でも読めば即解決なことや、クローリングや統計局などのデータの集め方、一般人にはよくわからない経済指標などのデータの読み方、他人が分析したデータをどう判断すればよいのか、さらには、とある企業の身辺調査というアンダーグラウンドっぽいことまで多岐渡って頼みごとがやってきます。

 

こうして常に可能な限り人々の期待に応えようとしていましたが、余所様のデータを無償で分析するのは、いくつかの例外を除き、良い考えではないということにようやく気付きました。遅すぎますわ。

 

誤解しないでもらいたいのですが、頼まれた際に何のためらいもなく手を差し伸べたくなる人々はいます。偉大すぎる師に頼まれれば嫌とは言えませんし、親類のデイトレーダーに頼られたら「あんたも懲りないね」と見捨てるよりも「ペアトレードだとこれじゃないか」とか、ついつい協力してしまいます。病院の院長に頼まれたら渋々と手伝うでしょうし、レンタルビデオ屋のオーナーは条件付きかもしれないけれど、大学の恩師なんかに頼まれれば無碍にはできませんから、会議で置物くらいにはなります。カキ氷手伝ってくれた居酒屋さんならきっと財務だって見てあげるでしょう。

 

しかし、残念ながら、あまり良い行動でもありません。

 

よくある事例として、データ提供という研究材料を餌にして、業績に困っている大学の研究室や、食うに困っている小さなベンチャーにデータ分析を依頼する企業がそうです。それに喜んで飛びつく研究者も情けないことですが、かといって、TwitterFacebookなんかの外に落ちているデータを分析するしかない、なんていう時点でアカデミックの凋落は始まっているかもしれませんが。データを渡して「良い結果なら提案してくれ」といった感じの、なんでも提案名目でタダ分析させるバイイングパワーの強い企業なんかはかなりしたたかです。タダ仕事とってくる営業や経営者も問題ですけども。

 

こうした人達は、タダで分析してあげても、その恩を仇で返すかのような行動に出るときがあります。そこで今回は他人のデータを無償で分析するのはお勧めできない理由を10個挙げることにしましょう。

 

 

#1:データから何もわからなくても、すべてあなたのミスになる

 

当たり前ですが、データの分析を頼んでくるのは、自らで問題を解決するだけの十分な知識を持っていないためです。ですから、たいていの場合、依頼主は問題となっている原因や、その解決方法を理解していません。だから軽い気持ちで依頼できますが、実際の問題は千差万別であり、開けて見なければわかりません。精度の高い見積もりなんて不可能です。分析の仕事で、人足の工数なんていう概念やめましょう。

 

例えば、あれこれやったところで結果のでていない微妙なサービスと大量のログだけ持っていたりします。にもかかわらず、データ分析できる人はいないかと嘆くだけで問題の因果関係を理解しようともしません。実際にはすでに分析したことがあっても黙殺されていることすらあります。

 

その結果、あなたが手助けした後で、改悪された場合ならまだしも、何も変わらない場合ですら、すべて、あなたのミスによるものだと解釈されるおそれがあるのです。現状維持でしかないのなら無能扱いされるのです。逃げたら逃げたで「おお、データサイエンティストよ、にげてしまうとはなさけない!」となります。

 

 

#2:あなたの時間が尊重されないこともある

 

データを分析する時間とはプログラミングの工数よりも、はるかにブレの大きいものです。私も自らの時間が尊重されないという大きな問題を抱えていました。依頼主たちは昼夜関係無しにメールや電話をかけてきて、私の作業に割り込み、誰よりも自分の依頼を片付けてほしいとお願いします。しかし、データの分析が終了する時間はわかりません。大量のデータを機械で回しておけば自動で解決なんてのは夢物語であり、そこまで行っているのなら、ほとんどの常人(依頼主)にとってはもう問題ではないのです。あげくFacebookTwitterの発言までチェックしてお前は暇そうなのに、なぜ私の仕事は終わらせてくれないのだと逆恨みすることさえあると知人の研究者はこぼしていました。

 

 

#3:さらなる問題を引き起こす可能性もある

 

私がタダでデータの分析をおすすめできない3つ目の理由は、もしデータの分析の結果が間違っていた場合に、責任をとらされることがありえるということです。逆恨みもたいがいにしろということですが、実は情報というもので商売しようとするのなら避けて通れない壮大な問題でもあります。簡単に言えば、親しき者同士では政治と宗教だけでなく、株銘柄推奨の話題すらご法度なようにです。関係を維持したいのならやめておきましょう。あの株は絶対上がる!と発言して、相手に大損させてしまったとき、関係が破綻するのはもう何度も見てきました。気象庁に良いイメージを抱いている旅館やホテルはほとんどいません。大雨や台風の予測で顧客減しても当日は快晴だったりするからです。地震や災害の予測精度も微妙です。けれど無いより有るほうがいいのは誰もがわかっています。このようにデータの分析は、感謝されることより、がっかりさせることのほうが多いのです。儚い職業ですね。

 

 

#4:人は無償のものに価値を見出さない

 

なんにでも言えますが、人間は人生において最も価値あるものは最も高価なものであるという考えを繰り返し、脳に刷り込まれています。つまり、せっかく高度なデータの分析をしたところで、タダなら、そのアドバイスは誰のアドバイスよりも安っぽく受け止められてしまう場合があるわけです。有償の場合ですら、分析結果を軽く扱う人が多いのですから。タダならなおさらというわけです。これも知人の話ですが、研究者の彼をものすごく熱心に引き抜こうとしてきた経営者がいたので、内緒で、それも無料で手伝ったそうです。転職前に相性を判断したかったんでしょう。いわゆる手弁当ですね。そして予想に反して即時撤退すべきであるという鋭い分析結果と助言を伝えたところ、今度はその経営者(分析経験はありません)は自分の直観とは違うといい、助言は無視され、その後、音信不通になったそうです。2年後、その会社も潰れたので彼は正しかったようです。

 

 

#5:無償の分析を今後もずっと期待する

 

幸運にも、良いデータの分析ができたとして、誰かの役に立ったとしても、そうした成果のせいで逆に困った状況に陥る可能性もあります。なぜなら、依頼主がまたしても助けを必要とするようになった場合、あなたのおかげで助かったことを思い出すからです。私もそれを繰り返して腐れ縁ができていったわけですけども。某お偉いさんは夕飯さえ食べさせれば、私の休日一日を拘束できると思っているようですけど、勘弁してくださいね。面と向かって言いにくいし、ここで書いても仕方ないんだけども。

 

 

#6:人は無償のデータ分析が得られると、危険な行為に走りがちになる

 

最も困ったことです。ようするに極論しますと、データを分析する行為というのは、手法やアルゴリズムとかじゃないんです。

 

データの分析のビジネス的効用とは承認行為そのものなのです。

 

暴言吐いてごめんなさいね。私が、セクシーな職業だとかデータサイエンティスト万能みたいな話がウソくさくて文句ばっかりなのもそれが理由です。分析経験がない人からの依頼はぶっちゃけこうです。「細かいことはよくわからないけど、あなたが保証してくれるんだよね」と。データ分析したのだから大丈夫だろうという安心とお墨付きがほしいのです。メディアの御用学者と同じ存在理由というわけです。こうして一旦、外部承認を得て大丈夫だと思ってしまうと、自らで問題を回避しようとはしなくなってしまうのです。このため、危険な行為や筋の通らない行動に走ってしまう可能性があります。分析結果を真に受けて予算を取って無謀な賭けに挑む人が悪いわけではありません。それ言ったら投資活動はできません。しかし、他人に信をおいて勝てる道理もありません。他人に信をおいて勝てるのは社会ネットワークの覇者だけです。いわゆる一握りの有名人だけです。「これだけ儲かるかも」の裏には「これだけ損するかも」が表裏一体なのですが、後者を理解する人は相当の熟練者であり、理解できない人からしたら、ただのネガティブな変人に見えるでしょう。

 

 

#7:分析関係の手助けだけでは済まなくなる

 

無償でデータの分析をお勧めしない理由には、その作業がデータの分析だけで済まなくなる可能性があるからです。あなたがデータの分析だけでなく、C++プログラミングにも強いと分かると、なぜかEXCELのVBAでマクロを作らされることになるかもしれません。簡単な例を挙げると、ある経営者に依頼されて財務分析をしてあげたら、彼の出張プラン策定と宿の予約までさせられたことがあります。楽天トラベルのポイントだけでは割にあいません。

 

 

#8:雪だるま式に範囲が広がっていく

 

時折、タダでデータの分析をしてもらえるという期待が、誰に対してもタダでやってくれると期待にまでふくらんでしまう場合があります。少し昔のことですが、大学の研究を無償で手伝ったことがありますが、そうすると別の大学から依頼が来て、それらも成り行きで手伝いしました。さらに別な大学から講演なども依頼されるとか、このときは連鎖6コンボ、当然、本業はボロボロになりました。そういうことは実務者はほどほどにすべきだと理解しました。上述の研究者の知人は、私と同じ分岐で、さらに国の役人に呼ばれてワークグループという名のタダ缶詰させられたそうです。逆に、この連鎖で気をよくした研究者が起業する場合もありますが、それはそれで有償の世界を知らないので大変でしょう。

 

 

#9:あなたの分析というサービスは無償ではなく、あなた自身のお金と時間が出て行っている

 

つまり無償というのは自分から見たら何かしらのマイナスということです。例えば、あなたが依頼主と話し合うときは、おそらく交通費を持ち出すことになります。食費はまさか割り勘ではありませんよね。また時間だけでなくハードディスクや電力、印刷する紙とインクといったサプライ品を消費することにもなります。こっそりと高価な分析ソフトウェアまで使ってやってあげていたり。 ここでは善悪は論じませんが。

 

 

#10:データの分析は無償でも有償でもほとんど変わりがない

 

残念ながら、分析の作業は無償でも有償でも、やるべき作業は何も変わらないのです。問題を解決するために1日中、働いているのであれば、本業のオフィスを離れてからも、余暇すら本当に同じ作業をやりたいと思えるでしょうか。私がその手の研究やブログや啓蒙活動に熱心な人を尊敬するのはそういうところにあります。無償でやるなんてそれはもう偉人としか思えないのです。

  

 

人間は、高価なモノをありがたがる習性があります。だからタダはやめましょう。

人間は、ちゃんと分析したのか、誰が言ったのか、承認と保証を求める習性があります。だからタダはやめましょう。

 

その不都合を理解してもなお、たとえタダであっても、分析してあげたい何かと誰かを、あなたが持っているのなら、それは幸せなことです。大事にしましょう。

 

 

 

関連記事

 

たとえ有償でも絶対に引き受けてはいけないデータ分析依頼の3タイプ

http://tjo.hatenablog.com/entry/2013/10/26/162038

 

無償じゃなくて有償でも引き受けてはならないクエストがあるというid:tjoさんの勇気が感じられる記事。独断専行の多い私は1が日常なので3も耐性ありかもですが、目的と手段が逆になっている世界である2の手法の固定では結果は出せないので即退散です。

 

 

 

  

参考記事

コンピュータの修理をタダで引き受けてはならない10の理由

http://japan.zdnet.com/it-management/sp/35038255/

のフレームを拝借しました。内容は違いますが、似通っているところもあります。

 

「もしも起業したいと言われたら」 知識労働職からの助言40プラスワン

タイトルは私の愛しているドリフのコントじゃないですよ。最近はいろいろあってデータサイエンティストに対するモチベーションがゼロです。そろそろ燃え尽きそう。ほんと書き続けられる知力体力のある方を尊敬します。

 

起業もそうですよね。あらゆる理由で、決して燃え尽きてはいけない行動と言えるでしょう。だから私には無理です。すぐ燃え尽きます。何度も繰り返し。

その何周目かには株や金融ネタのアフィリエイトやネット広告媒体契約なんかで、家賃くらいは稼いでた時期もあったんですが、それもサブプライム暴落にて、やる気もお財布も力尽きました。まあ年収級の銭を溶かして笑いものになりながらブログまともに書ける奴なんてまずいないわけですけども。Yahooと楽天なにしてくれんのよ。

斯様に体たらくな自分にとっては、社長になるなんて降格に等しいのです。けれども今は、リスクとリターンにあまりトレードオフを感じない不確実性の時代です。創意工夫次第で、稼ぎだけならなんとかできるくらいの機会は、日本にはまだ落ちています。そこだけはポジティブです。

 

そういう偏った認識のこんな私でも、起業の相談をされることがあります。あれこれ痛い目にあっているからなのか、私に相談する時点で目が曇っているんじゃないのとも言えますけども。

 

では、古いつきあいの友人Qから相談されたようなので、よってたかって、いろんな人からアドバイスをもらってみましょう。

 

 

Q「起業しようと思うんだけどうまくいくだろうか」

 

 

プライベート

 

「お前が決めた道なら止めはしない(失敗して頼ってきたら困るなあ)」

 

「そんなこといって失敗したらどうするんだい(案外うまくいくかもしれないわ)」

 

友人

「お金、貸してやるけど幾らまでだからな。がんばれよ。」

 

 

 

ベンチャーの社長(ネガティブ)

「大変だよ。やってみないとわからないことだらけだ。ほんといろいろ起きるよ」(くたびれた顔で)

 

ベンチャーの社長(ポジティブ)

「まかせてくれ。先輩としてアドバイスをしてあげよう。それには僕を取締役にすることだ。それとも増資がいいかい?」(テカテカした顔で)

 

中途半端な役員

「僕を取締役にするとこんなに得だよ、きっと君の損にはならないと思う、監査役でもいいよ」(上目遣いで)

 

ベンチャーキャピタリスト

「なぜ?何を?事業プランは?収益計画は?デューデリしてほしい?・・・で、株いくら交換する?」(仏頂面で)

 

ベンチャーキャピタルのトップ

「2012年度のVCによる投融資額は約1240億円と米国の約19分の1なんだよ(市場小さいんだよな)」

 

エンジェル投資家

「ベンチャー業界が活性化してほしいので私のお金を役立ててください。(ぶっちゃけ目をつけられてて使い道ないんですわ)」

 

競合他社

「うちの業界は厳しいよ。まったく入るチャンスもないわ。やめといたら。」(長い悲惨自慢の後で)

 

MBA国内

「なぜお前じゃなきゃダメなのか、リーダーとしての適正はあるのか」(燃えたぎる視線で)

 

MBA海外

「本当に成功したいのなら世界を狙うべき、だから最初から海外にオフィスを作ろう」(あさっての夢を抱いて)

 

大企業の偉い人

「それは弊社にどれくらいの利益をもたらすのか?弊社が担ぐ商品としてふさわしいのか?」(数字しか興味ありません)

 

某元社長

「利益率の高い商売、在庫をできるだけ持たない商売、月極めで定額の収入が入る商売、大資本の要らない商売」(お元気そうでなによりです)

 

マーケッター

「~~っていうサービス知っている?あれ良いと思うんだよね。市場も~くらいあるんだよ。やらなきゃ他社がやっちゃうよ。」

 

統計屋

「1年以内に過半数が倒産し、5年以内に80%が消え、10年以内に95%が倒産するよ」

 

データサイエンティスト

「まず君の事業をモデル化してみよう。市場の需要と、財務状況は数値化できるかい?できたら1万社のデータがあるからシミュレーションしてみようか」

 

コンサルタント

PDCAサイクルが重要です。このマトリックスではあなたは競争優位にいたりいなかったりします。」

 

自己啓発屋

「起業家が読むべき~~を見ましたか?お金の貯まる仕組みや~の行動は~ですよ。けれど、そうしたからといって成功できるほど甘いものではありません。」(お決まり文句)

  

FP&アクチュアリー

「起業するあなたの進む道にはこんなリスクあるのです。そのため保険と年金などの生活設計が重要です」(とりあえず商売しておくか感)

 

銀行家

「正直、最初のうちは頼ってほしくないね、成長したら強引に貸し付けにいくから待っててね」(豹変っぷりをアピール)

 

営業

「売れるかわからんもんは売りたくない。それ売れるの?売れるなら売るよ」

 

エンジニア・現実派

「作りたいのはそれだね。で、俺を引き抜きたいなら幾らくれるの」

 

エンジニア・ライフハック

「事業開発にもアジャイル活きると思うんですよね、ブレストしましょうよ」

 

エンジニア・絶望派

「クソみたいな職場から出られるならなんでもいいけど、ところで、あんたはクソじゃないよな」

 

エンジニア・求道派

「俺は俺の道がある。道が重なったら手伝ってやってもいい」

 

エンジニア・外人

「ヤトッテクレタラ、在留資格ガ、モラエマスカ?」

 

税理士

「会社は最初から経理が重要です。私らが顧問をやってあげますよ。」

 

弁護士

「契約書の読めない人は起業しちゃいけませんよ。最初から私が手伝いましょう。」

 

社労士

「従業員の働きやすくするために最初から、略」

 

医者

「初期のベンチャーではストレスで内臓疾患にかかる傾向が高いから気をつけたまえ」

 

占い師

「あなたは必要なときにお金がなくて苦労するかもしれません」

 

 

 

大学教授

「うまく成功したら先輩紹介とかパンフレットに使ってあげるよ、あ、共同研究と研究費もよろしくね。」

 

ポスドク

「できればあのその私も手伝ってもよかったりしたらいやその働きたいんですよね」(島抜けを控えめに希望しつつ)

 

学生・女

「ヤクザな仕事はお断りします」(就活後は気持ちが変わります)

 

学生・男

「社長っすか。すげー、自分もあこがれているんです。」(乾いた目で)

 

大学TLO

「その技術は大学で研究してたものじゃないんですか?」

 

 

 

役所

「安倍首相はベンチャーファンドに出資する企業の税制優遇措置を打ち出しているので今しばらくお待ちください」

 

政治家

「君のところの技術はどれくらい注目されると思う?いかに世間の評判(票)に貢献できるのか説明してくれないか」

 

経済産業省

「なんでもいいけど、大学発ベンチャー1000社計画とか、情報大航海とか黒歴史を参考にするのはよせよ」

 

総務省

「ICTベンチャー向け技術評価制度の開始してるんで受けてみませんか。何に使えるか私らもよくわかっていませんけど。」

 

文科省

「あー法科大学院の惨状が(略)」

 

IPA

「未踏プロジェクトいかがすか。最近注目されないんですよね。つこうた、から風当たりは強くてね」

 

 

 

 

助言が 40でもなくてごめんなさい。これは有望な起業の場合です。これくらいも言われないとしたら期待されていない(協力してもメリットがない)のです。気付きましょう。期待されないと動きやすいメリットもありますが、そもそも資金調達で苦労します。

 

これと似たような展開の話を聞けている方なら、かなり期待されていると思います。ただし、ご覧のとおり、各人の欲望の最適解がすべて違います。これらステークホルダーの最適解を解くなんて不可能です。まさに次元の呪い。聞けば聞くほど、調べれば調べるほど、細分化して、達成すべき目的が異なって、わけがわからなくなっていきます。無限に知識は拾えるけれども、あなたの記憶も判断力も人付き合いも資金も時間も有限なのです。

 

私は、私なりの最適解として、いつも、こう言うことにしています。

 

「勝てばすべてよし。もし負けても、友達はやはり友達だよ。そして、敵もやっぱり敵だ。世界は何も変わらない。」

 

とあるレンタルビデオ屋とビールと映画記事の経済効果

三部作?のラストの予定だったのですが、時差ボケダウンで尻すぼみだった中編は書き直しますので一度引っ込めます。なのでこれが後編です。前作を読んでいなくても読めます。

 

シネマアナリティクス : ゼロから分析力を磨きたい人に観てほしいマニアック映画5つ(洋画編)

http://negative.hateblo.jp/entry/2013/09/11/153406

の続きです。

 f:id:dsca:20070807091158j:plain

画像はイメージです。

 

複数店舗を経営するレンタルビデオ屋のオーナーが居酒屋でクダ巻いてました。それもそのはず、TSUTAYAとGEOで過半数を占めるレンタルビデオ業界は前年割れの続く厳しい業界です。私は仕事の話を終えて、レンタルビデオ業界の景気はどうなっているのと聞きました。

 

「俺はレンタルビデオ店がレンタルビデオ業界だと思っていないよ。飲食店だと思っている。」

 

その答えに痺れました。市場性の本質を突くものだと思いました。市場性とは自社が本当はどの業界にいるのかを知り、自社サービスと訴求対象となる人々の認識を理解することです。現在の買い手(顧客)はテクノロジーの進化によって「売り込まれる」ことに過敏なため、逆に嫌気がさして買わなくなってきているのは事実です。そのため、市場性の理解が重要です。市場性とは、調査やテストや事前データから読み取りにくいことであり、そのために物事の周縁と少し先の未来を見つめ、顧客の意欲と動機を理解し、認識する必要があります。市場性がマーケティングと少し違うのは、市場性とは事前に行われるものであり、正しく行われるのであれば費用はかからないということです。

  

最近ちょっとしたブームなのか、映画紹介、流行ってきましたね。ありがたいことです。たぶんレンタルビデオ屋さんは喜んでいます。なぜでしょうか。それをお話したいと思います。

  

「物語」を読み込みたい人に贈る映画5本

http://azanaerunawano5to4.hatenablog.com/entry/2013/09/13/122825

この方はすごくよく映画を見ている人だと思います。視点にこだわりがある。エレファントは私も好きです。

 

ラスト・伏線・どんでん返しがすごい!本当に面白い映画10選

http://matome.naver.jp/odai/2137931492284044701

もっとクソ映画に高い金払って勉強したほうがいいよと思う選択の軽さ。あんまり映画見てない方でしょ。でもNAVERは稼げてなんぼね。

 

映画に限りませんが、このへんは学習曲線というかPageRankアルゴリズムを応用した、にわかとマニアな選択分岐点のわかる面白い分類方法があるので、そのうち紹介したいと思います。

 

その他、たくさんのおすすめ映画まとめリスト

http://matome.naver.jp/topic/1M0FL

NAVERまとめってほんと敏感で素晴らしいと思います。良い映画が掘り起こされてほしいです。

 

映画がたくさん視られてほしい立場なので、この状況は願ったりです。だいたい目的は果たしたと勝手に思いました。次のネタに「こだわり派とにわか派における映画の選択傾向の法則」、「人間無視のアルゴリズムで選ぶ、おすすめ映画TOP1000(多すぎ)」とかやってみますかね。

 

今回はネットでそれなりに動きがあったのなら実社会ではどうなのか。なかなか世の中に出てこない隠されたテーマを語りたいと思います。

 

ということで、レンタルビデオ屋(いわゆる実店舗)をイメージしてください。そこにおけるDVDの品数(在庫)とはいかにして決まっているでしょうか。

  

ネットのように制約が無さ過ぎるものと違いまして、ほぼすべての業態の店舗は売場面積が、かなり重要な要素となってきます。売場面積は簡単に変動できないので、ほぼすべての業態では限られた面積でいかに売上を最大化するかという問題に帰着されます。レンタルビデオ屋ならば、どれだけの種類のレンタルコンテンツをいかに限られたスペースで陳列し、回転(品切れなく効率よくレンタル)させて売上最大を目指すかは永遠の課題です。

 

例えばレンタルビデオの横でゲーム売っている物販の合わせ技な店舗もありますが、それはつまり商品ではなく売上高/売場面積の最適化を考えてのことです。レンタルビデオという業態が先ではないのです。

  

某大手レンタルビデオチェーンにもデータサイエンティストがいるならば、データ量と設備を誇ってる場合じゃなくて、もっと良い在庫回転率と在庫最適化にしたらいいのにと思うでしょう。

 

しかし、実際にやってみると、とても厳しい問題でした。

 

何の映画をどれくらいの品数で陳列したらよいのかは実に難しい問題です。新しい映画とは、ほぼ未知の変数ですから、ビッグデータだ、データサイエンスだ、などといったところで、そう簡単にはわかることではありません。私がビッグデータやデータサイエンティストをさも救世主だとかセクシーだとか万能扱いする記事を嫌う理由がまさにこれです。

 

今までのデータから傾向がわかる継続的な要素ならば、既存データがあるほど強いです。それは試行における大数の法則としても明らかです。しかし、今までの傾向を打ち壊す存在について、既存データはほとんど無力なんですよ。万能などころか先入観を補強する足枷の場合すらあります。

これはアルゴリズムに傾注しがちなエンジニアや、ソーシャル大好きマーケッター、ブームがすべてジャーナリストにはわかりにくいことです。実際の現場とデータに触れていない人ほど実感しにくいことです。もちろん売上はある程度は分布に従うとは思います。しかし映画は基本的に同じ作品はありません。ワールド・ウォー Z (World War Z )が、ゾンビ映画だからといって過去のゾンビ映画の売上実績が参考になるでしょうかということです。投機の世界では、そういうデータ主義のアンチテーゼ的な分析方法もあってアベノミクス前までは結構、良い成績だったりしました。

 

だからレンタルビデオ屋の事前データとしては、映画の劇場公開の興行収入(動員数)くらいしか参考にならない(もう少し変数ありますけど)という、なんとも頼りないデータしかほとんどないわけです。ミニシアター系あるいは劇場公開すらしてない場合、もうまったく話題すらないので、もうほとんどデータはありません。立地差、店舗差、地域差による値の分散も激しいです。

 

中古ゲーム市場でも売れたゲームほど値崩れする現象でも明らかなように、たいした根拠もなくても、レンタルでは見込みで新品を入荷し、陳列せざるを得ないわけです。Amazonのレコメンドのようにお薦めを提示することもリアル店舗では難しい問題です。なぜなら客は皆、名前順とジャンルで探すことに慣れているからであり、レコメンドでその順列を崩したら、かえって探せずに不満が募るでしょう。

  

そうです。レンタルビデオ屋とはデータ的には極寒の不毛の地なのです。

  

また機会損失よりも最適化の傾向が強いため、人気がないならすぐに(売場面積のために)すぐに消すことはありますが、人気が出た後からDVD枚数を追加するなんてほとんどありません。最初にDVDを5枚入荷して順次、減らしていくのはOKですが、1枚がすぐ品切れになるからといって5枚追加したりしません。そういうときは回転率のために1週間レンタルを2泊3日したりします。

 

だから邦画界の愛すべき駄作、興行成績が火の鳥になっているガッチャマンもレンタルビデオではたくさん並ぶでしょう。それは間違いありません。話題と作品の評価を取り違えざるをえない(分離できない)からです。加えて商売上の理屈や版権や、いくつかの闇も変数として加わります。場合によっては株より難しい予測が求められる世界です。株よりシビアではありませんが、すごく興味深いデータ(そして当たりとハズレ)な予測をする現場です。

 

もちろん他にも、マーケティング、キャンペーン、陳列、回転率、レイアウト、在庫調整、人件費、バイトの色恋問題、DVDケースをシャッフルする困った客、延滞金の取り立てバックレ、子供のDVDが少ないとキレるモンペア・・・大なり小なり問題だらけで大変みたいです。

 

映画好きな私はたまに彼を趣味的に手伝っています。そのモチベーションはもちろん、自分のオアシスを維持するためにです。年とって落ち着いたら自分もレンタルビデオ屋でも構えて勝手に分析に明け暮れたいところですが、カキ氷屋ほどすぐにはできません。

 

ということでネットほどに実店舗は、Pivotもできず機動性もないわけです。そして有限面積における在庫最適化はすごく重要です。そして需要予測の当てにくい世界。このへんにビックデータがあれば改善していくんですかね。あまりそう思えないんですけど。

そこで予測が当てにくい世界であるという前提に立つならば、当てる未来を自分で作るしかないのです。つまり予言の自己成就を目指すしかありません。在庫最適化の次は自前で需要創出というわけです。いろいろ勉強になりました。

 

最後に経済価値をささっと算出してみましょう。オーナー的には面倒は困るというのでネットでの実名公表は控えさせていただきますが、都内のとある店舗における前回のおすすめ映画5作品のレンタル実績(合計)です。ご協力感謝なのですが、大人の事情により、とても読みにくい印刷されたデータを手入力をしたので根気的にこれが精一杯です。どうか伝わってください。蛇足ですが他2店舗も上がっていたのは確認済みです。

  

f:id:dsca:20130919024222j:plain

とある1実店舗における映画5作品の合計レンタル回数(記事投稿は9/11)

 

これぞ人力の伝統的アドテクノロジー。経済効果感じますね。ステルスでもない市場性。効果を実感しています。素晴らしいですね。ちなみに9/14が0件ですが貸出中(在庫切れ)が80%に達していたためです。

 

ここは比較的顧客も多い中規模店舗なので多いので割り引いて(マニアックなので在庫がない場合も考慮して)1店舗あたり、記事による増分効果を平均3件とおきましょう。新作じゃないド旧作なのでレンタル料金一本200円とします。レンタルビデオ店店舗数http://todo-ran.com/t/kiji/15331より、2013年の店舗数をざっくり3500と仮定すると、

 

1記事

=1店舗あたり +3本レンタル効果×200円 = 1店舗あたり売上増分 +600円

=全国のレンタルビデオ屋経済効果 600円×3500店舗 = +210万円

 

お、とても妥当っぽい経済効果が推定できました。本ブログでは料率3%とおくと売上63000円な依頼記事や講演とすると8割引かれて12600円あたりが取り分。1万円くらいですね。他のいろいろ映画おすすめ記事もこんな感じの経済効果ありそうですね。

 

 

という話をしたらレンタルビデオ屋のオーナーはビール(売上増分相当600円)おごってくれました。

 

どうもありがとうございました。

 

 

 関連記事

 

シネマアナリティクス : ゼロから分析力を磨きたい人に観てほしいマニアック映画5つ(洋画編)

http://negative.hateblo.jp/entry/2013/09/11/153406

本記事の前編です。どれも面白い映画なので秋の夜長にぜひどうぞ。

 

労働の二極化に抵抗する、上級者への簡単な道~とあるカキ氷屋の統計技師(データサイエンティスト)

http://negative.hateblo.jp/entry/2013/09/03/200255

誰もやらないことをやりたい派なんです。悲観的な人間なので何かしないと不安で。

 

お詫び:

中編は見直すとめちゃくちゃショボくなってたので改めて書き直します。時差ボケで頭ボケでした。ひっこめてしまった数万件データの話にフォーカスします。

@id:tjoid:tonerikoenid:webdevid:K-granola、@

他、みなさま、ごめんなさい。

 

シネマアナリティクス : ゼロから分析力を磨きたい人に観てほしいマニアック映画5つ(洋画編)

夏も終わり、カキ氷屋の清算と後片付けもさめやらぬ中、オリンピック景気の経済余波で謀殺されてたので、今回は世間ズレした血迷いネタです。他でやっとけって話なのは重々承知です。ごめんなさい。ただその、缶詰めな仕事帰りに、魂のスパロボ映画、パシフィック・リムを視て最高だったんですよ。今年ベスト級。頭の中ではどうしても、バグフィックス・ムリに置換されるからきっと疲れているんです。

 

映画が大好きです。ストレス発散に映画館(私のお気に入りは有楽町界隈です)、仕事の休憩にレンタルと、仕事が多忙だろうとも月に10~20本は見ている暇人です。言い訳すると実務に直結した理由もあるにはあるのですが、さておき、出張時の長い移動時間のお伴だったり、マシンルームでの休息&仮眠がてらだったり、隙を見つけては観ています。

 

それでも、一日中Youtubeやニコ動で時間潰ししているバーンアウト管理職や、毎日TEDを見てはパワポいじくってる天下り経営者よりは、仕事しているので大丈夫です。PS3(トルネ&ナスネ)とPSPのコンビは今の私の必需品です。

 

分析屋と映画は、ものすごく相性が良い、いや良くあってほしいと願っています。

 

なぜなら、データ→情報→知識という懐かしのナレッジマネジメントみたいな流れの最上流には「物語」がそこにあると思っているからです。伝達記憶能力の最大化だけでなく、受け手の意識の革新すら目指した最上位の情報の形として。経済学の気鋭、アカロフの「アニマルスピリット」でも示されているように、まだ未開拓ながら、物語論は行動経済学の研究テーマの一つでもあります。

 

たとえ物語が現実ではなくとも、未知なる試行(思考)実験の結果の集大成として作品が出来たことは事実です。リリースされた以上、あらゆる制約とリソースのと才能の美しい(ときに汚い)調和の形なのです。「予算がなくて正直すまんかった感ありあり」とか「困ったら殴り合いで解決かよ」とか「裸で尺稼ぐならもっとやってくれ」とか、どんな見方であれ、飽きることなく、いろんな角度で楽しむことができます。

 

このように映画にはあらゆる要素が詰まっています。2時間前後のほどよい芸術です。客観としての断片的なデータや情報から始まったものが、主観としての物語に収束していく過程が、たまらなく面白いと思います。逆に、テーマが発散しまくってわけがわからない感じや、伏線張りっぱなしで投げっぱなしで終わる力不足ある作品は微妙ですが。優れた作品は制約と成果の調和が本当に美しいものです。

 

分析屋の仕事もそうですよね。本来はデータから得られる拡散した情報をきっちり収束させて、知識なり意思決定なりに昇華させて、システムに組み込むことが仕事です。だから予算とか時間がなくて分析結果がショボくなるのは忍びないことです。

 

私は自分の仕事も、ある意味、作品(←たいしたことないくせに)だと思っている人間なので、できるだけ満足のいくものにしたいと思っています。だから、私にとっては映画は非現実ではあるけども「ああすればこうなる」or「こうなってはいけないのでああしない」的な貴重な学習の事例集なのです。

 

で、タイトルは、シネマアナリティクスなんという大層な言い方をしていますが、元ネタは長崎大学医学部発の映画の登場人物の言動から精神医学を学ぶシネマサイキアトリー(cinema psychiatry)なるものがありまして、ビジネスマンのメンタルヘルスツールになりそうな試みで、すごく共感しています。

 

その分析屋版があったらいいなと思いまして、分析視点を磨くのに良い映画はないだろうかと思ってまとめたものです。人気とか最近の有名作品ではなく、分析視点で面白い映画ですので、レンタルできないということはほぼないと思います。では、分析力を磨けると思うオススメ映画を5つ、ご紹介いたします。

第1位 「マネーボール」 すべての直観を超える、アルティメット分析無双。

第2位 「イーグルアイ」 もしもこんなビッグデータがあったら(ドリフ調)

第3位 「ヤバい経済学」 不動産屋&お相撲さんコンビが織りなす八百長の科学。

第4位 「ソーシャル・ネットワーク」 ハーバードとパクりとエゲツナイ仲間達。

第5位 「猿の惑星 創世記」 「わかるって面白い」パシリ扱いなサルの青春反抗期。

・・・と思ったのですが、これじゃ有名どころすぎ&普通すぎて何か違う。もちろん名作ぞろいではありますが、別に雑誌依頼記事でもないので、ここは少しだけマニアック度を上げて選びなおします。かといって入手困難にならない程度に。

 

ということで、独断と偏見に基づいた見識の狭い、分析力を磨けると思うオススメ映画を5つほど、余計なお世話な感じですが、ご紹介させていただければと思います。どれも渋みあるアダルト向け作品ばかりですけども。もちろん、このブログでは単なる趣味的な紹介でしてアフィリエイトなどの別な意図はまるでありません。レビューを観て面白そうだと思ったり、未見でしたら機会あれば、ぜひご覧いただければ幸いです。きっと楽しいですよ。では、紹介します。

 

 

 

f:id:dsca:20070802091700j:plain

 

第1位 永遠のこどもたち

 

原題: EL ORFANATO/THE ORPHANAGE

製作年度: 2007年

製作国・地域: スペイン/メキシコ   上映時間: 108分

 

解説: 『パンズ・ラビリンス』のギレルモ・デル・トロをプロデューサーに迎え製作されたスペイン発のホラー映画。短編映画やミュージックビデオ制作で活躍するJ・A・バヨーナが初の長編監督を務め、主演は『美しすぎる母』のベレン・ルエダ。『クライムタイム』のジェラルディン・チャップリンや、『宮廷画家ゴヤは見た』のマベル・リベラが脇を固める。緻密(ちみつ)な人物描写は単純なホラー映画とは一線を画し、母親の深く強い愛をサスペンスフルに描いている。

 

あらすじ: 孤児院で育ったラウラ(ベレン・ルエダ)は、長らく閉鎖されていたその孤児院を買い取り、障害を持つ子どもたちのホームとして再建しようと夫のカルロス(フェルナンド・カヨ)、息子のシモン(ロジェール・プリンセプ)とともに移り住んでいた。だが、シモンは遊び相手のいない寂しさから空想上の友だちを作って遊ぶようになり、その姿にラウラは不安を覚える。そして入園希望者を集めたパーティーの日、シモンはこつ然と姿を消してしまい……。

http://info.movies.yahoo.co.jp/detail/tymv/id329774/

 

 

この映画が最高である理由は見る人によって解釈が変わることです。出来事は一つ。しかし解釈は複数。というわけです。データは一つでも、分析者次第で結論が異なる事例はよくある話。なので分析屋にとって大変示唆に富む映画です。イベント分岐は複数、だからエンディングも複数というマルチエンディングなゲームとかありますが、この映画は出来事は一つながら解釈を分けさせるという超難度の脚本と地味だけど的確な演出がピカ一です。

あなたがどういった解釈と結論に辿りつくかわかりませんが、この映画をホラー映画としてではなく人間ドラマとして解釈できたのなら、分析に対する感性、論理的な素養があります。普通に見ればホラー映画のようです。つまり、上記の解説でホラー映画と書いてあるのはミスリードですけども、あえて騙されるのも一興です。どちらが正解かはあまり重要ではありません。無意識に自分の子供時代を息子に投影する母親の視点など、論理的な解釈をするためのヒントは劇中に、丁寧に散りばめられているので見逃さなければ辿りつけるでしょう。

どっちとも解釈できる系の類似作品に「パンズ・ラビリンス」や、もはや古典「氷の微笑」などがありますが、いずれにしても見方を一つに定めるなんて野暮でしょうね。

 

 

 

f:id:dsca:20130910230600j:plain

 

第2位 ミッション:8ミニッツ

  

原題: SOURCE CODE

製作年度: 2011年

製作国・地域: アメリカ   上映時間: 93分

 

解説: 『月に囚われた男』のダンカン・ジョーンズ監督の長編第2作となるSFサスペンス。列車爆破事故の犯人を見つけるべく、犠牲者が死亡する8分前の意識に入り込み、爆破直前の列車内を追体験していく男の運命を描く。困難なミッションを課せられた主人公を、『ブロークバック・マウンテン』のジェイク・ギレンホールが熱演。巧妙に練り上げられたプロットと先の読めないストーリー展開に引き込まれる。

 

あらすじ: シカゴで乗客が全員死亡する列車爆破事故が起こり、事件を解明すべく政府の極秘ミッションが始動。爆破犠牲者が死亡する8分前の意識に入り込み、犯人を見つけ出すという任務遂行のため、軍のエリート、スティーヴンス(ジェイク・ギレンホール)が選ばれる。事件の真相に迫るため何度も8分間の任務を繰り返すたび、彼の中である疑惑が膨らんでいく。

http://info.movies.yahoo.co.jp/detail/tydt/id340423/

 

この映画はタイムマシンもののSFのように感じられますが、分析屋としての究極の目的である試行と予測、それを極めれば、きっとこうなるでしょうという夢を具現化した初めての映画(小説ではイーガンなどSFに多くある普遍的テーマですが)ではないかと思っています。映像になるとものすごく刺激的です。

この映画では8分間しかない世界でひたすら試行実験を繰り返して究極の答えに近づいていくわけです。過去のデータの中でアルゴリズムのバックテストを繰り返すかのごとく。すべての出来事を試行して(途中で何度も失敗して)最終的に、最短経路で成果を出していく終盤の主人公の行動は、常人を遥かに超えていて本当に超人のようです。

なお私の場合、主人公を機械学習プログラムとして(原題がSOURCE CODEだけに)捉えて再鑑賞したときに、面白い学習モデルを思いつきました。一方、最適化された行動や手法が人智を超えたように見えるという意味でも大変面白いです。結果で肯定されるけれど人間に説明できなくなる類のデータマイニングのようで。

また、仮想空間と実社会の繋がりの不思議が明らかなるとき、ビッグデータの衝撃、巨大なデータが戦略を変える(和書の力作ですね)かのような、今の風潮に近しい気もするという壮大で興味深いラストです。予測を極めた超人の頭脳はこうなるという意味では「リミットレス」なども面白い演出です。主人公シャブ中ですけど。

 

 

 

f:id:dsca:20130910230944j:plain

 

第3位 LOFT

  

原題: LOFT

製作年度: 2008年

製作国・地域: ベルギー   上映時間: 117分

  

解説: 『ザ・ヒットマン』のエリク・ヴァン・ローイ監督による、ベルギーで大ヒットを飛ばした密室ミステリー。5人の男性たちが共有するロフトで起きた殺人事件の謎を、彼らの秘密とともに暴いていく。メインキャストを演じるのは『ザ・ヒットマン』のケーン・デ・ボーウや、『戦場のレジスタンス』のフィリップ・ペータースらベルギーの名優たち。情事部屋を手にした男たちの欲望が生むいびつな人間関係と、先の読めない展開に目がくぎ付け!

 

あらすじ: 警察で建築家のビンセント(フィリップ・ペータース)や、精神科医のクリス(ケーン・デ・ボーウ)らがある殺人事件の事情聴取を受けている。彼ら5人は友人同士で、瀟洒(しょうしゃ)なマンションのペントハウスを共同で使用していた。ある朝、その部屋でルク(ブルーノ・ファンデン・ブロッケ)がベッドで手錠をかけられた女性の死体を発見し……。

 http://info.movies.yahoo.co.jp/detail/tymv/id334858/

 

リメイクの2010年版もアメリカでのハリウッドリメイクも決定されている名作ですが私はベルギー版が好きです。往年のネットバブルの近い領域にいた私は、半端な成功者が好色によって身を滅ぼす確率が高いことを目の当たりにしてきました。調子こいて投資目的用マンションいくつも買うんですよね。どうせ資産管理できやしないのに。この映画でも成功した男達は秘密の逢引き部屋を持って、プライベートを共有しようとしますが、もちろん上手くいかないどころか、どんどん事件に巻き込まれていきます。経営者、成功者ほど孤独と言いますがそれもそのはず。秘密を持つほど共有できないのは世の道理。

この映画は題名どおり、男の聖域である隠れ家=プライベートなデータを暗示しており、機密を共有することの難しさ、情報漏えい防止、仲間との信頼の程度を巧みに表現している映画なのです。情報に多く触れられる人間や、お金で片付けられてしまえる人間は、自分の能力を錯覚して、えてして悪巧みを考えるものですが、それを仲間(と思っているだけで大人なら利害関係あるってわかるよね)と上手くやるのは実に難しいことである。と、自戒させてくれる映画です。経営者な方は信頼する役員とぜひ一緒に見てください。疑心暗鬼になれますよ。

成功して疑心暗鬼を誘発するという意味では「ゼア・ウィル・ビー・ブラッド」などもかなりの名作です。

 

 

 

f:id:dsca:20130910231110j:plain

 

第4位 瞳の奥の秘密

 

原題: EL SECRETO DE SUS OJOS/THE SECRET IN THEIR EYES

製作年度: 2009年

製作国・地域: スペイン/アルゼンチン   上映時間: 129分

 

解説: 長年勤めた刑事裁判所を退職した男が、25年前の未解決殺人事件をモチーフに小説を書き出すものの、過去の思い出に支配され苦悩するサスペンス・ドラマ。アルゼンチンを代表する名監督ファン・J・カンパネラが1970年代の祖国の姿を背景に、過去と現在を巧みに交差させ、一人の人間の罪と罰や祖国の軌跡を浮き彫りにする。また、本作は第82回アカデミー賞外国語映画賞を受賞。主演は、カンパネラ監督作品の常連リカルド・ダリン。衝撃的な秘密が暴かれるラストに言葉も出ない。

 

あらすじ: 刑事裁判所で働いていたベンハミン(リカルド・ダリン)は、定年を迎え、25年前に起きた忘れ難い事件をテーマに小説を書くことにする。それは1974年、新婚生活を満喫していた女性が自宅で殺害された事件で、担当することになったベンハミンが捜査を始めてまもなく、テラスを修理していた二人の職人が逮捕され……。

 http://info.movies.yahoo.co.jp/detail/tydt/id337041/

 

 

解説で言うほど衝撃的なラストではありませんが、大変良くできたサスペンスです。人生の試行回数は1回。間違えることもあるし、望む結果が得られないことのほうが多々あります。それに自分が悪くなくても世の中が夢を打ち砕くこともある。その無常は、あるいは時間という凄みは、技術がどんなに進んでもきっと表現できません。きっちり時間をかけていくことでしかわからないことがあると教えてくれる映画です。

現実は理想には届かないことが多いけれども、それでも希望は失われないこと、膨大な時間の中の愛情と執念の凄みを教えてくれます。彼と女上司、ダメ人間の関係こそは、私の目指すイベントの蓄積と言っても良いでしょう。損得や恋愛感情を超えた繋がりが起こす執念と行動はどちらも凄まじいと思いました。

言葉にならない情報、この場合は題名どおり、目の動きがそれを語っているわけです。目は口ほどにモノを言う。ビッグデータやらWebアクセス解析でも同じと思います。言葉より行動が語る世界。なお長い年月をかけた重厚な物語という意味の人間ドラマとしては「題名のない子守唄」も傑作です。計画と実行と成果の儚さを描く、この映画も傑作なので、未見ならぜひ。

 

 

f:id:dsca:20130910231305j:plain

 

第5位 ミスター・ノーバディ

  

原題: MR. NOBODY

製作年度: 2009年

製作国・地域: フランス/ドイツ/ベルギー/カナダ   上映時間: 137分

  

解説: 『トト・ザ・ヒーロー』『八日目』で知られるベルギーのジャコ・ヴァン・ドルマル監督が、不死の世界になった近未来を舞台に人生の選択について描くユニークなファンタジー。世界で唯一残った死を迎える人間の過去をさかのぼり、その男と3人の女性とのそれぞれの運命をつづっていく。主人公を、『ロード・オブ・ウォー』のジャレッド・レトーが演じるほか、サラ・ポーリーダイアン・クルーガーら魅力的な俳優陣が共演。美しい音楽と共に映し出される映像や、パズルのような展開を繰り広げる独特の世界観に酔いしれたい。

 

あらすじ: 2092年、化学の進歩で不死が可能となった世界で、118歳のニモ(ジャレッド・レトー)は唯一の命に限りある人間だった。ニモは記憶をたどり昔のことを思い出す。かつて9歳の少年だったニモの人生は、母親について行くか父の元に残るかの選択によって決まったのだった。

 http://info.movies.yahoo.co.jp/detail/tydt/id338055/

 

 3人の女性から1人を選んでみたときの人生、という追体験ができる思考実験としても面白い映画です。こちらは事実は複数あって解釈が複数あるというマルチエンディングです。人生にはいくつのも選択肢があり、それらには同等の価値があるというわけで、人生の分岐と選択肢を、あのときこうしていたら、別な道を選んでいたら、というパラレルワールドを体現している映画です。

ただし、いかんせん理解も難しい(つまり、好きなように構成していい)ので賛否両論あるようです。一つの解釈としては、すべて少年の妄想とも解釈できるので、そう思って鑑賞していればわからずにイライラすることはないと思います。この映画の良いところは過去(あるいは未来)の映像美だけでなく、美しくないとき、悪いときを、多く描いていることです。

データ「マイニング」という言葉が指すとおり、素晴らしい成果とは砂金発掘なわけです。つまり裏には膨大に無用な石ころがあるのです。毎日、そこそこに膨大なデータを見ている私としては、1つの選択のために、別な選択肢を大量に捨てています。経済学的にはサンク(埋没)コストを気にしてはいけませんが、そこに潜って考えなければいけない反省点や、持ち帰れる知見もたくさんあるのです。この映画を見た後は、自分も別な道を選んでいたら・・・と思考実験をしても楽しいと思います。なお、この映画はバタフライ・エフェクト(私はミステリ風のパート3が好きです。)に似ていますが、こちらのほうが多面的で時系列がわざといい加減な作りなので小難しいです。

 

 

以上、私の独断と偏見による分析好きな人の良い素材になりそうだと思う映画紹介でした。

 

最後に、まとめますと

 

第1位 永遠のこどもたち

第2位 ミッション:8ミニッツ

第3位 LOFT

第4位 瞳の奥の秘密

第5位 ミスター・ノーバディ

 

とは、つまり分析における

 

1. データは一つでも人間の認識は複数

2. 機械学習と試行実験の奥深さ

3. 情報における機密と共有の難しさ

4. 時間と言葉以外の情報の大事さ、人間の執念と奥深さ

5. 選択と検証のわかりづらさ。人生の試行回数は1回、分散なし。

 

というメッセージを含んでいまして、私なりの養成読本として咀嚼いただければ幸いです。

 

感じろ考えるなという意味では、有名どころの表編BEST5のほうが面白いと思いますが、私は、感じるな考えろ派の人間ですので、一癖あって深読みできる少しマニアックな映画を紹介しました。一風、変わったレビューということでお許しください。もちろん異論は認めまくります。メジャーどころな作品はたいがい観ているので、マニアックに面白いのがあったらぜひ教えてください。映画については趣味がてら興味深い分析がたくさんあります。それはまたの機会に。

 

私の趣味につきあっていただき、どうもありがとうございました。

 

関連記事

 

とあるレンタルビデオ屋とビールと映画記事の経済効果http://negative.hateblo.jp/entry/2013/09/19/144243

一応、後編です。経済効果の算定しています。

 

 

そのうち

・分析力を磨きたい人に観てほしいマニアック映画5つ(邦画編)

・分析するほど、はずされる困った展開のマニアック映画BEST5

・観た後に熱く語りたくなる情報伝搬力の高いマニアック映画BEST5

・ソリッドシチュエーションに名作なしと言われても仕方ないお手軽映画BEST5

・セクシー女優と爆発シーンでごまかしているだけのC級映画BEST5

・WebやITやビッグデータをテーマにした映画って微妙なのが多いよね映画BEST10

 なんかも書きたいところです。

 

本記事はid:tjoさんの

『データサイエンティスト養成読本』はゼロからデータサイエンティストを目指す人なら絶対に読むべき一冊

 のインスパイアです。データサイエンティスト本を映画で置き換えて書けるかなと。

労働の二極化に抵抗する、上級者への簡単な道~とあるカキ氷屋の統計技師(データサイエンティスト)

 本記事は長くなりすぎて端折った前回の続きです。前回を読まなくても読めます。

 労働の二極化に抵抗する、捨てるを捨てないという1つの選択肢 

http://negative.hateblo.jp/entry/2013/09/02/202445

前回言及できなかった意味不明なままのカキ氷まで話を広げます。

 

 

前回論じたように、スキルの差は拡大していく一方です。世の中には確実に上級者と呼ばれる人が存在します。これは一体なぜでしょうか。

 

経済金融だって医療だってネット広告だってどの分野でも同じことですが、上級者は皆、特化した戦力を持っています。経済を俯瞰する私のスコープから見れば、上級者とは需要に選ばれし者であり供給に見放された者のことではないかと思っています。

 

皆さん、特別なことではありません。会社組織業務のスコープを変えれば、個人家族友人共同体のスコープを変えるだけで、誰でもそうなりえます。

 

極一部なニッチな世界だけれどもFORTRANCOBOLの人材だって部分的に高騰しているんです。少し前ならユビキタスやらのデバイス開発でC++技術者が一気に消えたりね。ちょっと言いにくいけど、今なら某回線のネットワーク技術者なんかもいなくなりすぎて高騰しています。ADSLの時代は終わったと皆がいなくなったからこそ、残った需要が、相対的に価値が高まっているわけですね。ビッグデータ潮流がこのまま計算基盤に寄っていくならインフラエンジニア全体もそうなるかもしれません。ビッグデータという少々、誇張の混じったパンドラの箱にも最後に希望が残っているといいのですが。

 

 

どんな局面も60点取れますという汎用性では中級以上にはなれません。前述の二極化で述べたように、それ以上の仕事がもらえなくなる世の中になりつつあるからです。より能力の高い者、より信頼できる者、より速い者に仕事を発注したくなるのが心情です。より安い者は能力が等しいときだけの指標にすぎません。そのことを、もはや価格弾力性というより、スキル弾力性というべき造語を作って理解を試みます。

 

スキル弾力性は(ネーミングの意義は微妙に正しくないのですが)とりあえず、価格(や給料、サービスの対価)の変動によって担当する能力やスキルが変化する度合いを示す数値とします。スキル弾力性が小さい場合は、価格を変更してもほとんど担当者のスキルは変化しませんが、スキル弾力性が大きいと、価格が変わると担当者のスキルが大きく変化します。

 

つまり、今までのSIやシステム構築は人月計算や固定給としてスキル弾力性は小さく努めてきたわけです。しかし今後、分析やエージェンシーになってくると、ネット販促における成果報酬やファンドの信託報酬などでは明らかにスキル弾力性が大きくなっていくと予想されます。

 

したがって汎用スキルの用事はなく専門スキルと能力競争(=高度な属人性)になっていくと予想できます。100万円で50点の人間と、105万円で95点の人間のどちらかに発注できるとしたらどうでしょう。クラウドソーシングなどの潮流もあいまって、その流れはさらに加速していくかもしれません。すでに一部では、名指しの仕事が増えています。このように変動的な成果を約束する分析のような仕事においては、1つだけは100点を超える専門性と創造性の発揮でしか、今後の未知な仕事に、呼ばれにくくなっていくのではないかと私は危惧しています。

 

ある意味、それしか真なる上級者への道はありません。上級者の定義は、上司や仲間内の、組織内や村社会や属するコミュニティの評価ではまったくありません。世界や権威からの評価は、それに近いけれども少し違います。不要な権威は劇的に滅びるのでアテになりません。大学や病院のポストが詰まって新陳代謝が行われないのが良い例です。評価ではなく組織の硬直性で決まるのでは違います。

 

だから正確に言うならば、ほぼ当たり前のことですけども、真なる上級者とは

 

その人でなくては仕事ができない程度(代替財が存在しないか少ない)

その仕事の未来の需要(潜在需要)

 

で決定されます。個人に影響を与えることながら全体の問題であることに注意してください。個人が、会社が、メディアが、国が、何を掲げ何を言おうとも、それが事実です。それ以外にありません。つまり

 

自分の仕事が世の中で必要であり、それが他人にできなければ良いのです。 

品のない言い方かもしれないので、言い直しましょう。 

自分にしかできない仕事が、世の中に必要とされれば良いのです。

 

ドラッカーの「経済人の終わり」に代表されるように、かつて経済人(homo economicus)という「経済合理性のみを追求する完全に合理的な人間」という想定は様々な学者に批判されました。実際の人間は、多くの場合、利他的であり、そして経済学が想定するほど合理的ではないと。しかし、今後もほんとにそうでしょうか。このような極限の能力競争においては経済合理性の動きに近似していくでしょう。それを目指すわけですから届かなくても近づいていくはずです。限定合理性の枷がはずれる時代は近いかもしれません。

 

これは一見、かなり難しそうに見えますが、そうでもありません。  

 

実務者向けということで硬すぎる話でしたので最後に、解決に向かうために、私のエピソードを紹介させてください。今年の夏の実験を、軽く話して終わりたいと思います。

 

 

 

実は今年の夏は、カキ氷屋をやってました。本気です。

  

f:id:dsca:20100629113321j:plain

出展)画像はイメージです。実際はこれより全然ボロいです。

 

 

真夏の炎天下に屋台をひいて各地に出張しては、涼を売る、移動カキ氷屋です。

 

もちろん私も本業がありますので、カキ氷屋の司令塔としての参加です。日頃、お世話になっている居酒屋夫婦と夏休みで暇な専門学校生らと一緒に。もちろん(地域次第らしいですが)臨時営業許可もとりました。

  

移動カキ氷屋でもっとも大事なのは当たり前ですけど立地(営業する場所)です。氷とシロップの原価は最初から極限に低いのでほとんど操作変数としては不適です。あとは接客サービスですがそこは居酒屋夫婦にまかせます。

  

私の担当は出没(出店)エリアの調査と探索スケジュールの決定、実際の販売結果と購入者の傾向を分析し、次々に計画を修正しながら利益の最大化を目指すことでした。わかる人にはわかると思いますが、巡回カキ氷屋問題(?)を解くわけです。

 

 

イチゴ一杯300円。ミルク50円。ちと高いです。強気の設定です。

 

 

最初はひどい赤字でした。誰もいない公園や河川敷でやったり、ゲリラ豪雨で閑古鳥だったり、怪しげな人間(役所の人ごめんなさい)にイチャモンつけられたりと、苦戦しました。出没場所はモンテカルロ法っぽく、最初から思い込まないように近郊から適当に数拠点選びました。そこから計測された売上高で絞り込んでいきました。

 

並行して、どの要因が利益に結びつくかの因果関係が重要です。共分散構造分析(SEM)で最適化していきました。やはり、やってみなければわからないことだらけです。まったく予想と異なり、まるで未知の要因が、もっとも利益に直結していることがわかりました。そこからはその要因を基に、地図データや検索エンジン(他の事例)を使って、どんどんパラメータの当てはまりの良い場所を探索しては、営業先候補にしていきました。

  

最初の段階で、ひどい赤字を出して皆に衝撃を与えておいた(ごめんなさい)ので、関係者は炎天下の労働でも音をあげませんでした。ゆっくりでも改善されていたので希望が見えていたからと思います。信頼されるためには最初の期待値を低くすることは大事だと実感します(ごめんなさい)。他のほとんど差別化要素がないと排除したため、次元の呪いもありません。せいぜいカキ氷屋の分析のためにPC1台が占有される程度で、簡単そうで奥深い、面白い分析と予測ができました。

 

季節要因も相まって、苦戦した7月、上向きと分析の8月1週、そして実践の8月の2~3週、お盆頃には、ついにカキ氷屋における約束の地を見つけ出し、辿り着きました。そこで根を張り、後はひたすら営業を続けました。

 

私の予想は良いほうにはずれました。ありがたいことに最初は苦しかった移動カキ氷業も、約束の地に辿り着いてからは私の予想を軽く超え、大繁盛しました。一安心です。猛暑の中、営業努力を続けた居酒屋夫婦も専門学校生も喜びました。専門学校生はバイト代でバイク買ってました。

 

とはいえ、カキ氷なので所詮、売上は微々たるものです。株のほうが当たれば全然稼げます。けれど移動カキ氷屋は、超ローリスクで粗利がとても高いのです。だって水だから。スキルも不要です。誰だってできます。簡単なのです。

 

 

 

そう、ただ誰もやらないだけです。

私ほど移動カキ氷屋においてデータ分析した人はいないでしょう。

 

 

つまり、そういうことではないでしょうか。

 

 

 

どうもありがとうございました。

 

 

 

 

補足)

今夏は今週で店じまいです。私らの屋台だとわかってもそっとしておいてくださいね。よろしくお願いします。

  

来年も稼ぐ予定なので詳細は内緒です。

 

食いっぱぐれてきたら

「とあるカキ氷屋の統計技師(データサイエンティスト)」

でも書きます。カキ氷屋の闇を抉る分析屋の渾身のルポタージュ。

職質されたとか、熱中症で倒れたとか、汗かいて5kg痩せたとか。

 

便乗してごめんなさいね。たまたまかぶったもので・・・

 

 

関連記事

 

データの分析における、たった1つの重要なイベント(実務者向け)

http://negative.hateblo.jp/entry/2013/08/28/203059

実務者向けメッセージ。文句ばっかりいっててごめんなさい。

 

労働の二極化に抵抗する、捨てるを捨てないという1つの選択肢 (実務者向け)

皆さん、カキ氷好きですか。カキ氷。私は大好きです。ほんのりとした甘さの後に、キーンと意識が覚醒する感じが、たまらないですよね。そのせいなのか、職場で冷たい奴と思われてるからなのか、5300年前の氷河から発見されたミイラのように古びて埋もれた存在だからなのか、本業ではアイスマンと呼ばれたりします。たまらないですね。どうでもいい前ふりはさておいて。

 

 

巷では「早期リタイアを目指せ」だとか「年収1000万円が一番幸せ」だとか「秒速で1億円」だとか「稼ぐが勝ち」だとか、いろんな意見や提言があります。統計的に言えば、誰がどんなことを言って何をしても97%の人は関係ありません。私も負け惜しみっぽく関係ないと言っておくとして。統計としては日本人の生産人口の3%が年収1千万以上だからです。日本人は例外を嫌う習性がありますが年収だけは誰もが例外になりたいのが人情というものです。

 

 

少し昔、いや今でも、若い世代の台頭を喜び、(若い人限定の)グローバル人材論をぶちあげ、海外で修行している人が海外に出てこいと手招きしています。そういう人は語る資格もあると思うんですが、ちゃっかり国内で生活して築いた地位がありながら、ポジショントークでお前らは海外に行けと騒ぐ投資家や経営者もいます。メディア御用達な評論家にも多いのですが、日本で育った人材と海外で育った人材のその後を人生追跡のA/Bテストも行っていないのに、よくもエイヤッなアジテーションができるものだと思います。アカデミックな方には、ぜひ国内外キャリアを追ってA/Bテストな研究してみてほしいところです。きっと面白い研究テーマですよ。おそらく驚愕の結果が待っているでしょう。実際のところ、海外留学組などは国内から見れば厳しい雇用状態で、海外留学の効果はマイナスに見えるほどです。もちろん例外的な強者は数は少ないけどどこにでもいますけど、それは単に生存バイアスにすぎません。統計は無情です。嘘だと思うなら人材紹介会社のデータに聞いてみてください。間違えていたら訂正します。

 

 

少しだけ種明かしをしておきます。海外で敗れた疲れた日本人は、当然、日本に戻ってくるしかありません。ところが日本は社会制度設計的に再チャレンジが難しい国です。この国の流動性のなさは世界最強レベルです。語学はたいてい再就職の役に立たず(必要ではあります。しかし質と仕事の絶対量は違います)、日本の商慣習に溶け込むためには、海外で溶け込むために支払った努力以上の適応コストを再度支払わなければなりません。これは全世界共通の障壁です。母国以外で学び戻ってくると、語学取得コスト以外に、環境適応コストも倍増するからです。だから、海外に出ていった人が日本に戻ってくることは二重の意味で不利です。海外に学びに、働きに行ったのなら、そこで適応し、日本に戻らず働くのが有利でしょう。一方、一部の海外帰りの強者が圧倒的なリターンを叩き出すというデータもあるにはあるので、戦略の優劣や結果は試した後でしかわかりませんが。

 

 

無常な統計として言えば、ほとんどの場合、世の中の97%に収まってしまうこと。そしてキャリアや事業の方向転換(pivot)は明確なコストということです。

 

 

あれこれと不安を煽り、庶民を鼓舞し、イノベーション、起業、英語、クラウド、ビッグデータだと煽る流れがあったかと思えば、実際は就職氷河期だ、深刻な若年労働者の雇用不安だと、微妙な希望と絶望の矛盾した現実を抱えています。例えばポスドク問題がデータサイエンティスト的な潮流に(本来、別次元ながら)織り込まれているように。

 

 

昨今のブームで言えば、全社員、英語必修や、分析などの高度な(いくつかはすぐに消えそうな)スキルの取得をお題目に掲げていますが、私は学習と実行の順序が逆ではないかと思います。昔から習うより慣れろといいますが、現在は慣れるより習えになっているようです。知識の共有は進んだ一方、経験が育たなくなっている。

 

 

できる誰かを優先する世の中では、とりあえずの誰かの仕事はなくなり、さらなる独創的な専門性を身につける時間は用意されません。より高度なスキルに磨かれずに埋没していくでしょう。習うより慣れろなら、乗り越えて成長する機会もきっとあったはずなのに。できる誰かに機会を奪われて未成熟で終わっていく。一方、そのできる誰かも熾烈な人材争奪戦と高騰(id:tjoさんの推測)を経て、高めていけたはずの別スキルを獲得する機会が減っていく。できる誰かに高レベルの仕事が集中するがゆえに、降りることを許されずに、それしかできなくなって世俗と乖離していく。それが分析人材のキャリア・プラトーです。気づけば年を取り、専門スキルを発揮できなくなった頃には、管理、会計、育成、経営、・・・他のスキルが身についていません。それを若いうちに危惧できるのなら、それは一流の素質です。局所を極めるほど全体に不安になるものです。高額納税者ほど国を心配する気持ちと同じです。

 

 

これが現代における短期的なスキル二極化を起こし、長期的には多数の不幸を呼ぶシステムの一因でしょう。

 

 

例えば、海外MBAを修了した人でも英語の契約書というのはかなり難しいものです。2年も海外にいて経験を積んでもまだ足りない。しかし、本来、極めるということはそれくらいのコストを支払わなければいけないことです。他人に英語の重要性を説いていながら英語の契約書が読めないMBAが大半です。それが日本人の英語取得の95%上限でしょう。しかし海外の契約書を読めなくて海外で勝つのは難しいことです。もちろん、だからといって、それが間違っているとも思いません。それも競争社会を生き抜くための適応の一つですから。短期で中途半端にスキルを身につけることも一種の戦略です。ただ結果の出にくい社会構造が存在するということです。個人の問題として論じてはいません。それゆえに属人や組織の力でそれを乗り越えていくストーリーは語り継がれたりもします。

 

 

では同じ理屈で、身につけるべき系のスキル本にあるようなスキル一覧をすべて身につけるには、どれくらい時間がかかるか考えたことがありますか。

  

例えば、技評や日経(個人的には嫌いですが)あたりのお家芸でもある、なんとか技術者の養成読本の類をイメージしてください。もちろん、そのお仕事ぶりを非難してはいません。単に、そのお題目をすべて学ぶにはどれくらいのコストがかかるでしょうか。という問いです。

  

簡単な推定です。わかったつもりの自己満足なら1日でもいいですよ。だけど実用レベル(=もちろん競合と競争可能なレベル)になるのにどれくらい時間かかるでしょうか。

 

例えば、仮にHadoopとかの導入から基本実装など学ぶ(バージョン問題とかあれこれ面倒深いのですが)としてみます。お題目ごとに100時間くらいとおいてみましょう。hiveやmahoutなどの派生スキルは別なお題目とします。専念したとしても最低1ヶ月くらいは必要とおきましょう。派生を考えれば身につけるべきスキルのお題目数はたいてい10を超えます(その手の本の目次を見てください)から、全部だと1000時間超。もろもろ1年は超えそうです。モラトリアムな方でもない限りは普通は仕事しながらのことなので専念もできません。だから専念1年、自習なら3年以上はかかる試算です。その間にも次々と新しい技術が知識が出てきていることでしょう。なんと3年前のことをきっちり学べた後、世の中は3年進んでいるのです。キリがありません。そういう推定からして、なんでもできる超人は最初からいないのです。ゼロから高度技術者を目指す人は、そのコストをあらかじめ見積もって、何らかの割り切りが必要です。

 

  

商売にしている人は言いにくいことですが、あえて言います。ドライな判断が必要です。それはネガティブな意見かもしれませんが、無関心や皮肉とは違います。あなたや、あなたの会社を守るために必要なことでもあります。

 

 

実業務に関係がないのなら手を出さない

(100人以内の営業の事務処理ごときにHadoopは不要です)

 

とりあえず既存技術で代用する

(別にVBAでもEXCELでもいいじゃないですか)

 

許容できる時間であれば計算は遅くてもいい

(計算結果を待つ間に、以前のデータをよく読んで振り返ったらどうですか、予測のトレーニングにも最適です)

 

速度より安全

 

精度より試行回数

 

合理化よりステークホルダーとの蓄積

前回の記事を参考ください

 

習うより慣れさせる

 

熟練者に仕事を集中させない

 

初心者に仕事を与える

 

・・・

 

そういう割り切りも、ダサいとか非効率であるとか思考停止だと馬鹿にせず、考慮しましょう。うまくやってきた方法で勝負する。成功の呪縛ならば上等じゃないですか。成功していない呪縛に意味ありませんけど。やるもやらないも激変する競争環境にさらされながら勇気のいる決断です。短期的な損失を覚悟するから長期的な利得を追いかけられることがあると思いませんか。進むか進まないかはあくまで冷静に、分析してロジックを補強して対応しましょう。いままでしていなかった企業なら、そんなにWebアクセス解析が重要ですか。もう遅いですよ。それなら、さっさとやらない決断をして別なところにリソース使いませんか。Webのトラフィックなんかを追うよりも、物流のリアルなトラフィック見直すほうが企業業績インパクト高いですよ。

 

 

煽られるままであれ、自分なりの確信がある場合であれ、どんどん新しいスキルを獲得しようと意識高く学び続けることは適応のための戦略としては最高のものですし、素晴らしいと思います。ただ、そんなに続けられるでしょうか。無限のやる気と時間をひねり出せる方を私は知りません。

 

 

だから適応しないのも適応の一つです。捨てるという選択を捨てないことです。潤沢ではない会社の、97%の個人の、生き残り戦略としては、捨てることこそ、かなり重要なのです。無限の追従も模倣も不可能である以上、捨てるからこそ価値の追求ができることがあります。burn the bridgeしないほうがいいのは会社や個人の関係性くらいです。検討対象はどんどん捨て去りましょう。97%の誰もがラットレースに参加する必要はありません。

 

「データサイエンスを採用するか、それとも死か」、受け入れなければ競合が先に行くなんて余計なお世話なんですよ。そんなの自分で決めましょう。そもそも競合が先に行く世界を遅れて追いかけてどうするんですか。

 

 

どうもありがとうございました。

 

余談)

ドタキャン待ちぼうけくらって新幹線待っていたら、予想以上に長くなってしまったので次回に続きます。冒頭のカキ氷に話題が届きませんでした。ごめんなさいね。

私がカキ氷を好きな本当の理由が明らかになる(←超どうでもいい発言)のは続きにて。

 

 

 関連記事

 

労働の二極化に抵抗する、上級者への簡単な道~とあるカキ氷屋の統計技師(データサイエンティスト)

http://negative.hateblo.jp/entry/2013/09/03/200255

長くてごめんなさい。分割した本記事の後編です。途中から超展開します。

 

データの分析における、たった1つの重要なイベント(実務者向け)

http://negative.hateblo.jp/entry/2013/08/28/203059

実務者に向けたメッセージ。

 

データの分析における、たった1つの重要なイベント(実務者向け)

2年ほど前、私の仕事場に医療会社の社長が血相を変えて駆け込んできました。かつて私がシステムを設計したことがある会社の社長でした。すぐさま現状のヒアリングと現地調査が行われ、問題を発見しようと直ちにデータ分析が行われることになりました。業務上の横領や不正経理の疑いがあったためです。私がやった分析はシステムから作為的なデータ入力のパターンを見つけることでした。やり方には少々コツがありますが1週間もかからずに結果は得られました。横領の証拠こそありませんでしたが、請求額と支払先に一定のパターンが見つけられたので、従業員の中で組織的に不正が行われていて、一部の社員らによる経費の水増し請求が常習化していたことがわかりました。まったくひどい話ですが過去数年間には会計監査が何度も行われているというのに何もわかっていなかったのです。こうなる前に早期の対処ができたかもしれない機会が何度もあったのに。その後、この会社は粛々と正していきました。なぜか離職率も下がったそうです。

 

みなさん、珍しい例ではありません。残念ながらどこででもありえます。

 

Hadoopでデータを取り込んで集計し、Rで推論したり、EXCELで検定し、あれこれとデータ分析をしても、このようなことには気づけません。別にツールが悪いわけじゃありません。そういう問題を設定していないものはわからないのが当たり前です。では逆に問題を事前に想定し、折り込めたでしょうか。効率化を目的にしているのだから未来の例外コストにそこまで支払っておけないでしょう。そうでありながら、このような問題に迅速に取り組めたのはなぜでしょうか。

 

私はデータ分析が嫌いなわけじゃありません。たまに大学や勉強会で教えてますし、こうした技術も利用しています。

 

しかし、ここで言いたいことは、顧客と会話をして、現場に触れて、データ分析以外のことも行っておく必要があるということです。より良いデータ分析がしたいのならば。身に付けるべきスキル(といっても定かではありません)として特定のニッチな技術を偏重し、顧客とのふれあいを省略すると、場合によってはもっと重要な、改善可能な問題を見過ごしてしまうだけではなく、もっと大切な「イベント」が失われてしまうのです。「イベント」は分析者と顧客の関係に変化をおこし、より強力にする力をもっています。

 

今後10年間におけるもっとも重要な分析ツールがあるとするなら、私は依然として人間のことだと思っています。見て、聞いて、嗅いで、味わって、触れて、集めて、記録して、話して、考える、そして実験し、成果を向上させることができる。 

 

ビッグデータに代表される膨大なデータ収集から大量に調べられるようになったのはごく近年のことです。ご存知のとおり、ほんの少しだけ昔、社会システムをIT化するブームがありました。その後、WEB2.0のようにバージョン番号つければ新しく見えるという不思議なブームを経て、金融危機、バブル崩壊、世界情勢、少子高齢化、漠然とした危機感と期待感に煽られつつ、業務効率化とコミュニケーションコスト低減の流れが加速しました。

その流れの中では、そもそも問題はなんなのか、あったとしたらそれはどういった施策で、どのような結果がありえるのか、実際のところ、あまり調べてから実行されることはありませんでした。実施した後の検証などもっと行われませんでした。なので感覚的に物事を決めることは「エイヤッ」と呼ばれました。たいして分析も計画もされずに作り上げられたエイヤッなシステムのほうが圧倒的に多かったのです。エイヤッを肯定するために、問題領域の近い専門家や御用学者の意見、ITロードマップXXXX年版―情報通信技術はX年後こう変わる!に代表されるNRIやガートナーとかが言うから仕方がないよ的な風潮に後押しされ、そして、それが大好きな政府や経営者らによって、巨額のシステム投資と遠大なシステム構築が行われました。

こうして業務効率は、当たれば向上し、はずれれば低下しました。管理業務のための管理ソフトによる管理コストの増加などはなつかしい思い出です。そして必要とされるか替えが効かなければ生き残るシステムになります。逆に必要とされなければどんなに良い設計であれ優れた実装であってもシステムは淘汰されていきました。さらに市場のパイが増えていく中では人材不足という感覚は定常化します。いつも誰かが何かに不足し飢えています。それは情報過多と競争と不満足の裏返しですが、にもかかわらず、システムの検証やフィードバックを行われることは多くありませんでした。

しかしご存知の方もいるでしょう。SIerやSIベンダーという意味は顧客の業務内容を分析し、問題に合わせた情報システムの企画、構築、運用などの業務を一括して請け負う業者のことです。ゆえにデータサイエンティストはこれらのサブセットであり、焼き直しだと思う人がいるかもしれません。私もそうです。とはいえシステムインテグレータの登場は分析の転換期を象徴するものでした。

 

私は最近、あるデータサイエンティスト?な人間の集まる会議で批判を受けました。「ユーザは、もはやデータに過ぎなくなった」と言ったからです。データ分析、データサイエンティストなどがポジショントークであれなんであれ注目を浴びる一方、顧客はよくも悪くも素直にこう思います。

 

「一体なにを(理解できないこと)やってんの?」

「いつになったら僕のところに説明にくるの?」

「担当者は誰?」

 

私は一流の分析者の定義が、顧客と我々エンジニアの間で、かけ離れたものになっていることを懸念しています。最近では分析の様子はこうです。議論は顧客から遠く離れた開発室で行われ、議論の中心はパソコン上の可視化イメージとデータのみ。不可欠な要素である顧客が、ユーザーが、解決したい対象への理解が、抜け落ちかけている気がしてなりません。

 

私が影響を受けた2つのエピソードをご紹介したいと思います。

 

その1つは、地方病院の話です。この病院は経営状況の悪化と非効率な業務、コスト体質に悩んでいました。どのような施策を打てば良いのか。院長は国内では大手のコンサルティング会社に依頼しました。しかし半年後に私が挨拶に訪れてみるとコンサルティングを打ち切り、地元の小さなSIerと業務システム改善に乗り出していたのです。

私は驚いて院長に聞いてみました。

「なぜここでシステム改善をすることにしたの?」

院長はためらいながらも言いました。

「大手コンサルティング会社はよかったよ。本社も立派だったし、担当者も優秀だった。都内で良い経営している病院に連れていってくれる親切な方もいたよ。」

「でもね。一度も(出張して)病院を見に来てくれなかったんだ。」

 

現地を見る必要さえなかったと言えなくもありません。病院の経営データは遠隔で分析され、彼の病院を見る必要さえなかったわけです。けれど院長にとってはコンサルティングを諦めるくらい重要な要素でした。そして地元のSIerは病院内に開発室を設けてじっくりと分析して開発しているようです。実際には単なる常駐かもしれません。コストも相当かかっているでしょう。しかし院長はこうした手厚いケアを求めていたのです。院長が診察しているのと同じように。合理的ではない判断だと思いましたが、それが人間の判断でもあると私は大いに影響を受けました。余談ですが最初の医療会社の社長はこの地元SIerのことです。地方ながら都会の中堅ITベンチャーより利益を出していたり、上述のような大変な目にもあっています。

 

もう1つ、影響を受けた経験をお話しましょう。まだ20代の頃です。当時、私は少しだけ書籍やメディア、社内で注目されていて(今では廃れたシステムなので割愛)の第一人者という評判をもっていました。けれどあまり好ましい評判ではありません。というのも、なにせその技術は完全ではなく、それを自分自身が信用していないので不安でたまらないのです。扱っていた技術自体は当時の最先端計算技術ではあるのですが、たいていの案件は、他の業者から見放され、業務では苦い経験をし、私の所に来る頃にはもう解決などできないと期待していない顧客によるものでした。

こうした案件に最初に遭遇したとき、一辺倒で自分の得意なソリューションを提案しても、まったく相手にされませんでした。そして私も情報も自信も足りていないと思いました。実際、データ分析プログラムの問題でもなく、もっと初歩的なシステム構造の問題であったり、データ収集の仕組みであったり、組織構造の問題であったりと、全く当時の自分のスキルは役に立たないことが分かりました。だから諦めて実験することにしました。ヒアリングでは、全ての時間を使って顧客に当事者意識と問題の状態を語ってもらうのです。中断せずじっと聞くことにしました。普通のSIでは時間内に要件を定義しようと努めるのが一般的でしたが、私は何度もミーティングをして存分に語ってもらいました。正直いうと他にする事が無かっただけです。そしてさらに数倍のコストをかけて現地に入り浸って調査もしました。コストは高いのですが私だけだったので理解のある上司にも許してもらえました。分析して提案するのは調査が完全に終わってからでした。私が語るターンでは、いつもおしゃべりな顧客にも、静かに聞いてもらえました。そこで顧客と私はなにかITやWEBではない原始的なイベントを行っているという感覚になりました。私には役割があり、そして顧客にも役割があるのだと。その後、私は離れましたが、顧客には満足してもらえたようで今では取引は数倍になっているそうです。

 

現代のSI、分析の業務にはこのような視点が欠けています。流行りのデータサイエンティスト本やビッグデータ本などに、このような視点がまったく見当たらないのは少し残念です。これはコミュニケーション能力のことではありません。データを集める以前に、なぜ、問題をもっと明らかに、現地で調査したり、当事者に話を聞かないのでしょうか。データを読めば済む問題ではありません。しかしデータをよく読むために必要なことです。データを読み解くには、問題への当事者意識や理解の積み重ねが、分析者と顧客の双方に必要なのです。

 

そして私は顧客に分析した内容と改善提案を説明します。といっても、こんなものは他の分析者でも同じことが言える程度の内容にすぎないのです。けれども私の顧客が、存在しないマルチなスキルと深さを併せ持った超データサイエンティストや、どんどん利益を増やしていける超グロースハッカーや、前人未踏スーパークリエーターを探すことをやめて、私と改善のプロセスを歩み始めてくれるとしたら、それは改善施策を説明するに必要な信頼を築いたからだと思うのです。業務を通したイベントの積み重ねによって何か重要なものが生まれたのだと思います。 

 

例えば会社では新人歓迎会をやったりします。か弱い個人から組織の一員としての出発をお祝いしているわけです。これは過去の慰労ではなく未来への変化を知らせるシグナルなのです。会社も個人もさまざまなシグナルを発信します。会社なら繰り返される会議や飲み会だけでなく、入社、退職、休暇、株主総会、役員会、引越し、結婚、出産、組織変更、トラブル、障害、メンテナンス、契約、監査・・・・きりがないほどに。だからイベントはとても大事なものです。私は綺麗に見せたり悪く見せたりな財務指標よりもイベントを分析するほうが経営体質を詳細に把握できるとさえ思っています。

 

ある人が、とある人を訪れ、家族や役員には言いたくないことを伝え、驚くべきことに、隠された問題や秘密を話し、機密データを触らせる。それには、こうした顧客とのイベントの蓄積がとても重要なのです。セキュリティやリスクのために、情報を隠されたり、暗号化されたデータのまま分析したり、データを出し惜しみしたり、データの採取方法や、そのデータの意味を教えてもらえなかったり、こうしたイベントを省略すると、顧客と分析者の関係をつなぐ機会を失うことになるのです。分析は、たいていは当たり前だったり、ろくな結果は得られません。けれど翌日もまた同じ事を少しだけうまく行おうとするしかないのです。知識を急速に増大させ、ビッグデータを踏破しつくし、無関心に陥らないように。データが重要だというのなら、データに残らないものこそ大事にしなければならないのです。

 

だから、データから問題を見つけるためではなく、ビッグデータから探すこととは関係なく、分析者が顧客に繰り返し伝えなければならないメッセージがあります。お互いがそれをわかりあうイベントの積み重ねが重要なのです。すべてを円滑によりよい結果と満足に導くために。

 

「私はいつもあなたをサポートします。決して見捨てません。一緒にやり遂げましょう。」

 

どうもありがとうございました。

 

 

関連記事

 

労働の二極化に抵抗する、捨てるを捨てないという1つの選択肢 (実務者向け)

http://negative.hateblo.jp/entry/2013/09/02/202445

待ちぼうけ二部作の前半。重苦しい問題提起編です。文句ばっかりです。

 

労働の二極化に抵抗する、上級者への簡単な道~とあるカキ氷屋の統計技師(データサイエンティスト)

http://negative.hateblo.jp/entry/2013/09/03/200255

待ちぼうけ二部作の後半。問題解決めざして超展開します。カキ氷、大好きです。

 

 

 

本記事は

エイブラハム・バルギーズ:医師の手が持つ力

http://www.ted.com/talks/lang/ja/abraham_verghese_a_doctor_s_touch.html

のリスペクトです。magnificentと激賞したいプレゼンテーションです。私の実感や体験とかなり近いと勝手に思い込んでしまった(←いい迷惑)ので思わず真似てしまいました。私ごときの実体験で置き換えたりしてごめんなさい。テレビを見逃して和訳など聞き間違えて理解したところもあるかもしれません。それもごめんなさいね。