読者です 読者をやめる 読者になる 読者になる

ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

データの分析をタダで引き受けてはならない10の理由

 

それなりの分析屋であれば誰もが経験があることでしょう。データを扱えない人から、データを扱える人と思われるために、分析の依頼をされることが。それも軽い気持ちから始まるタダ(無償、無料)の場合が。

 

そう呼ばれたくない実務者が多いのに、それを叫ぶ組織が多いという不思議な昨今のデータサイエンティストの流行はそろそろ終わってほしいのですが、データの分析という行為自体はいつの時代も不滅です。

 

私も企業や大学、知人や家族などからデータの分析を頼まれることがよくあります。もうしょっちゅうです。もちろんネットや金融やらのビッグデータに限ることではありません。だいたい相手は私が本業でやっているニッチな統計処理なんて理解していません。ただ、なんとなく、あいつに聞けばいいみたいな風に思っているだけでしょう。それはEXCELの使い方から、簡単な統計処理の説明といった参考書でも読めば即解決なことや、クローリングや統計局などのデータの集め方、一般人にはよくわからない経済指標などのデータの読み方、他人が分析したデータをどう判断すればよいのか、さらには、とある企業の身辺調査というアンダーグラウンドっぽいことまで多岐渡って頼みごとがやってきます。

 

こうして常に可能な限り人々の期待に応えようとしていましたが、余所様のデータを無償で分析するのは、いくつかの例外を除き、良い考えではないということにようやく気付きました。遅すぎますわ。

 

誤解しないでもらいたいのですが、頼まれた際に何のためらいもなく手を差し伸べたくなる人々はいます。偉大すぎる師に頼まれれば嫌とは言えませんし、親類のデイトレーダーに頼られたら「あんたも懲りないね」と見捨てるよりも「ペアトレードだとこれじゃないか」とか、ついつい協力してしまいます。病院の院長に頼まれたら渋々と手伝うでしょうし、レンタルビデオ屋のオーナーは条件付きかもしれないけれど、大学の恩師なんかに頼まれれば無碍にはできませんから、会議で置物くらいにはなります。カキ氷手伝ってくれた居酒屋さんならきっと財務だって見てあげるでしょう。

 

しかし、残念ながら、あまり良い行動でもありません。

 

よくある事例として、データ提供という研究材料を餌にして、業績に困っている大学の研究室や、食うに困っている小さなベンチャーにデータ分析を依頼する企業がそうです。それに喜んで飛びつく研究者も情けないことですが、かといって、TwitterFacebookなんかの外に落ちているデータを分析するしかない、なんていう時点でアカデミックの凋落は始まっているかもしれませんが。データを渡して「良い結果なら提案してくれ」といった感じの、なんでも提案名目でタダ分析させるバイイングパワーの強い企業なんかはかなりしたたかです。タダ仕事とってくる営業や経営者も問題ですけども。

 

こうした人達は、タダで分析してあげても、その恩を仇で返すかのような行動に出るときがあります。そこで今回は他人のデータを無償で分析するのはお勧めできない理由を10個挙げることにしましょう。

 

 

#1:データから何もわからなくても、すべてあなたのミスになる

 

当たり前ですが、データの分析を頼んでくるのは、自らで問題を解決するだけの十分な知識を持っていないためです。ですから、たいていの場合、依頼主は問題となっている原因や、その解決方法を理解していません。だから軽い気持ちで依頼できますが、実際の問題は千差万別であり、開けて見なければわかりません。精度の高い見積もりなんて不可能です。分析の仕事で、人足の工数なんていう概念やめましょう。

 

例えば、あれこれやったところで結果のでていない微妙なサービスと大量のログだけ持っていたりします。にもかかわらず、データ分析できる人はいないかと嘆くだけで問題の因果関係を理解しようともしません。実際にはすでに分析したことがあっても黙殺されていることすらあります。

 

その結果、あなたが手助けした後で、改悪された場合ならまだしも、何も変わらない場合ですら、すべて、あなたのミスによるものだと解釈されるおそれがあるのです。現状維持でしかないのなら無能扱いされるのです。逃げたら逃げたで「おお、データサイエンティストよ、にげてしまうとはなさけない!」となります。

 

 

#2:あなたの時間が尊重されないこともある

 

データを分析する時間とはプログラミングの工数よりも、はるかにブレの大きいものです。私も自らの時間が尊重されないという大きな問題を抱えていました。依頼主たちは昼夜関係無しにメールや電話をかけてきて、私の作業に割り込み、誰よりも自分の依頼を片付けてほしいとお願いします。しかし、データの分析が終了する時間はわかりません。大量のデータを機械で回しておけば自動で解決なんてのは夢物語であり、そこまで行っているのなら、ほとんどの常人(依頼主)にとってはもう問題ではないのです。あげくFacebookTwitterの発言までチェックしてお前は暇そうなのに、なぜ私の仕事は終わらせてくれないのだと逆恨みすることさえあると知人の研究者はこぼしていました。

 

 

#3:さらなる問題を引き起こす可能性もある

 

私がタダでデータの分析をおすすめできない3つ目の理由は、もしデータの分析の結果が間違っていた場合に、責任をとらされることがありえるということです。逆恨みもたいがいにしろということですが、実は情報というもので商売しようとするのなら避けて通れない壮大な問題でもあります。簡単に言えば、親しき者同士では政治と宗教だけでなく、株銘柄推奨の話題すらご法度なようにです。関係を維持したいのならやめておきましょう。あの株は絶対上がる!と発言して、相手に大損させてしまったとき、関係が破綻するのはもう何度も見てきました。気象庁に良いイメージを抱いている旅館やホテルはほとんどいません。大雨や台風の予測で顧客減しても当日は快晴だったりするからです。地震や災害の予測精度も微妙です。けれど無いより有るほうがいいのは誰もがわかっています。このようにデータの分析は、感謝されることより、がっかりさせることのほうが多いのです。儚い職業ですね。

 

 

#4:人は無償のものに価値を見出さない

 

なんにでも言えますが、人間は人生において最も価値あるものは最も高価なものであるという考えを繰り返し、脳に刷り込まれています。つまり、せっかく高度なデータの分析をしたところで、タダなら、そのアドバイスは誰のアドバイスよりも安っぽく受け止められてしまう場合があるわけです。有償の場合ですら、分析結果を軽く扱う人が多いのですから。タダならなおさらというわけです。これも知人の話ですが、研究者の彼をものすごく熱心に引き抜こうとしてきた経営者がいたので、内緒で、それも無料で手伝ったそうです。転職前に相性を判断したかったんでしょう。いわゆる手弁当ですね。そして予想に反して即時撤退すべきであるという鋭い分析結果と助言を伝えたところ、今度はその経営者(分析経験はありません)は自分の直観とは違うといい、助言は無視され、その後、音信不通になったそうです。2年後、その会社も潰れたので彼は正しかったようです。

 

 

#5:無償の分析を今後もずっと期待する

 

幸運にも、良いデータの分析ができたとして、誰かの役に立ったとしても、そうした成果のせいで逆に困った状況に陥る可能性もあります。なぜなら、依頼主がまたしても助けを必要とするようになった場合、あなたのおかげで助かったことを思い出すからです。私もそれを繰り返して腐れ縁ができていったわけですけども。某お偉いさんは夕飯さえ食べさせれば、私の休日一日を拘束できると思っているようですけど、勘弁してくださいね。面と向かって言いにくいし、ここで書いても仕方ないんだけども。

 

 

#6:人は無償のデータ分析が得られると、危険な行為に走りがちになる

 

最も困ったことです。ようするに極論しますと、データを分析する行為というのは、手法やアルゴリズムとかじゃないんです。

 

データの分析のビジネス的効用とは承認行為そのものなのです。

 

暴言吐いてごめんなさいね。私が、セクシーな職業だとかデータサイエンティスト万能みたいな話がウソくさくて文句ばっかりなのもそれが理由です。分析経験がない人からの依頼はぶっちゃけこうです。「細かいことはよくわからないけど、あなたが保証してくれるんだよね」と。データ分析したのだから大丈夫だろうという安心とお墨付きがほしいのです。メディアの御用学者と同じ存在理由というわけです。こうして一旦、外部承認を得て大丈夫だと思ってしまうと、自らで問題を回避しようとはしなくなってしまうのです。このため、危険な行為や筋の通らない行動に走ってしまう可能性があります。分析結果を真に受けて予算を取って無謀な賭けに挑む人が悪いわけではありません。それ言ったら投資活動はできません。しかし、他人に信をおいて勝てる道理もありません。他人に信をおいて勝てるのは社会ネットワークの覇者だけです。いわゆる一握りの有名人だけです。「これだけ儲かるかも」の裏には「これだけ損するかも」が表裏一体なのですが、後者を理解する人は相当の熟練者であり、理解できない人からしたら、ただのネガティブな変人に見えるでしょう。

 

 

#7:分析関係の手助けだけでは済まなくなる

 

無償でデータの分析をお勧めしない理由には、その作業がデータの分析だけで済まなくなる可能性があるからです。あなたがデータの分析だけでなく、C++プログラミングにも強いと分かると、なぜかEXCELのVBAでマクロを作らされることになるかもしれません。簡単な例を挙げると、ある経営者に依頼されて財務分析をしてあげたら、彼の出張プラン策定と宿の予約までさせられたことがあります。楽天トラベルのポイントだけでは割にあいません。

 

 

#8:雪だるま式に範囲が広がっていく

 

時折、タダでデータの分析をしてもらえるという期待が、誰に対してもタダでやってくれると期待にまでふくらんでしまう場合があります。少し昔のことですが、大学の研究を無償で手伝ったことがありますが、そうすると別の大学から依頼が来て、それらも成り行きで手伝いしました。さらに別な大学から講演なども依頼されるとか、このときは連鎖6コンボ、当然、本業はボロボロになりました。そういうことは実務者はほどほどにすべきだと理解しました。上述の研究者の知人は、私と同じ分岐で、さらに国の役人に呼ばれてワークグループという名のタダ缶詰させられたそうです。逆に、この連鎖で気をよくした研究者が起業する場合もありますが、それはそれで有償の世界を知らないので大変でしょう。

 

 

#9:あなたの分析というサービスは無償ではなく、あなた自身のお金と時間が出て行っている

 

つまり無償というのは自分から見たら何かしらのマイナスということです。例えば、あなたが依頼主と話し合うときは、おそらく交通費を持ち出すことになります。食費はまさか割り勘ではありませんよね。また時間だけでなくハードディスクや電力、印刷する紙とインクといったサプライ品を消費することにもなります。こっそりと高価な分析ソフトウェアまで使ってやってあげていたり。 ここでは善悪は論じませんが。

 

 

#10:データの分析は無償でも有償でもほとんど変わりがない

 

残念ながら、分析の作業は無償でも有償でも、やるべき作業は何も変わらないのです。問題を解決するために1日中、働いているのであれば、本業のオフィスを離れてからも、余暇すら本当に同じ作業をやりたいと思えるでしょうか。私がその手の研究やブログや啓蒙活動に熱心な人を尊敬するのはそういうところにあります。無償でやるなんてそれはもう偉人としか思えないのです。

  

 

人間は、高価なモノをありがたがる習性があります。だからタダはやめましょう。

人間は、ちゃんと分析したのか、誰が言ったのか、承認と保証を求める習性があります。だからタダはやめましょう。

 

その不都合を理解してもなお、たとえタダであっても、分析してあげたい何かと誰かを、あなたが持っているのなら、それは幸せなことです。大事にしましょう。

 

 

 

関連記事

 

たとえ有償でも絶対に引き受けてはいけないデータ分析依頼の3タイプ

http://tjo.hatenablog.com/entry/2013/10/26/162038

 

無償じゃなくて有償でも引き受けてはならないクエストがあるというid:tjoさんの勇気が感じられる記事。独断専行の多い私は1が日常なので3も耐性ありかもですが、目的と手段が逆になっている世界である2の手法の固定では結果は出せないので即退散です。

 

 

 

  

参考記事

コンピュータの修理をタダで引き受けてはならない10の理由

http://japan.zdnet.com/it-management/sp/35038255/

のフレームを拝借しました。内容は違いますが、似通っているところもあります。