読者です 読者をやめる 読者になる 読者になる

ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

データサイエンティストの資格が必要ない理由2つ (改)

もう何年も、かなりニッチな統計処理をやっている人間です。そんな仕事をセクシー扱いされると、頭より、若さ=耐久力で商売しているって意味ではそうだろうな、と思うようになってきたので、またブログを書きます。
 
データサイエンティスト協会
 
とりあえず手を上げた感じだと思いますが、残念ながらスキルの要件を定義するところから始めてるようです。しかし、その試みは実にハードルが高く、非生産的な行為と思います。欧米ではもう好き勝手に名乗っちゃって転職時の給料が上がってなにやらカオスな感じが先進的ですけど。資格であるならば、それを取得した人の市場価値、待遇がよくならなければならない。それが運営する側のせめてもの矜持でしょう。けれどもスキル定義や資格なんか作ってもダメな理由があるんです。
 
で、私の持論としては
 
データサイエンティストのスキルを定義することはできない。したがって資格になっても価値がない。
 
です。なぜなら過去にそういった資格が市民権を得た(=認知され、定着した)ことがないからです。このままでは数々のIT資格やマーケティングのスキルように草の根的で残念な感じになるでしょう。
 
あってもよい理由は1つ。
  • 最低限の情報共有、啓蒙は必要だが
しかし、それ以上に我慢できない理由は2つ。
  • スキルを定義できるならサイエンティストではない
  • 目的のない手段だけの資格は成立しない 分析手法やツールへの傾注
なぜか。順番に説明しましょう。
 
 

最低限の情報共有、啓蒙は必要だが

 
例えば年金は労働人口からの搾取だけが目的ではありません。ある意味、国は国民に期待しておらず「納税者は将来のことを考えられない」という性悪説的認識のもと、国がお金を預かって個人の家計が破綻しないようにしてくれているというありがたくも迷惑な側面があります。年金について怒りを感じる人には、こうしたものが余計なお世話に見えたりします。
 
このようにダメなものを救おうという意味の制度として、勉強や啓蒙の構造を用意しようと言うなら少しはわかります。
ただ、資格やスキル要件を定義すべきってこととは関係ありませんね。普通に勉強会でもたくさんしたらどうでしょ。
資格やスキル要件を定義するのは、裏を返せば、勝手に名乗られちゃ困る、分析しちゃ困る、つまり俺達に話を通してほしい、認定してあげるから、っていうことだと思いますが、でも、これも余計なお世話な気がするんです。
せいぜい、「オラクルおら狂う」で有名なGoldだったのにSilverな資格みたいに持ってても何の得も損もない感じにしか機能しないでしょう。
 
 

スキルを定義できるならサイエンティストではない

 
ずばり、サイエンティストが新規性や普遍性を重視する者であるならば、スキルなんて定義できっこないわけです。だって従来と違う視点と知見を取り出すのが仕事なんだから。手持ちの武器を誰かさんに決められていいはずがない。例えばNoSQL使えなきゃデータサイエンティストじゃないなんて言われる筋合いはないわけです。Excelしか使えない人が分析屋であっても何ら問題ないんです。世界の進歩を、競争力を優先したいのなら、資格だ、スキル要件だなどと固めてはいけないよ!と思います。ほんま悪いこと言わんから頼むわ。業界の進歩のために、くだらない参入障壁や連帯意識を作るなと言いたいのです。
 
少し脱線ですが、この国の官学ではびこる悪癖であり、世界と戦えなくなっていく日本の弱点は、日本でしか通じない基準を設けることだったりします。もっというなら国内のみの規格化と、他国の規格の盲目的な遵守です。よくいるMBA留学崩れ的な「米国ではこうですよ、僕たちも守りましょう、真似しましょう」という輩はたいてい間違っています。そろそろバブル崩壊な某国を見てもわかるとおり、「お前らは俺たちのルールを守れ、俺たちは俺たちのルールすら守らないけどね」が成長スピード最大なわけです。日本でも、原発安全でも食品偽装でもITでもWEBでも、規格作れば作るほど、法律作れば作るほど、そしてそれを守るほど、すべてが鈍くなる=停止するのは自明ですよね。守りすぎるほど死ぬ最たる例です。データサイエンティスト要件に合致してないからお前にはデータ分析させない、みたいになったら本末転倒。だって目的は新規で普遍な分析結果を社会で有効に使うことでしょ?研究を誰がやってもいいように、データの分析だって誰がやってもいいんですよ。協会だか組合だかが、スキル要件だの資格だのと、わざわざ敷居を作るなんておかしいと思うんですよね。
 
ようするに、それで飯を食いたい「何も生み出せないけど整理して権威付けしてあげますよ」的な有識者、経営者とか、俺は権威持ってる大人だぜ的な規格ゴロな歴々がたくさん余っているのはわかるんです。ITスキル標準やらPマークやらITコーディネータやらセキュリティ標準やら未踏スーパークリエーター(←チトチガウ)やら、いまになってみるとなんだったの的な無駄な活動のように。だけど私は何らかのデータ分析を担う、実務な人たちにはそうなってほしくないんですよね。将来の日本のためにもさ。
 
だって失敗したら患者を殺しちゃう医者じゃないんですよ?国や大学や某な機関によって最低限の質を担保しなければならない道理がまったくない。場合によっては会社は死ぬかもしれません。けど、分析が間違っていても予想があたれば勝ちな世界でもあるわけで。毎回、問題も解決も違うから普遍性すら求めづらいし再検証もできにくい。
 
誤解してほしくないので、再度言うと、患者殺さないために、リスクを最小に抑えるために、医師という資格がありますが、データサイエンティストなるものはそれと明らかに違うのです。なぜならデータ分析して、リスクを最小にしたいなんて一つの目的でしかないからです。そんなの足枷にすぎません。弱い犬ほど鎖が好きなのです。たいていのビジネスはリスクそこそこにリターンを追いかけるものだし、ベンチャーだったらリスクとってリターン最大じゃなきゃ生き残れません。ビジネスや社会貢献を目指す分析においては、資格やスキル要件がリスク最小にする(組織)構造なんて余計なお世話なんです。
 
 

目的のない手段だけの資格は成立しない 分析手法やツールへの傾注

 
データサイエンティストという名前は、もう少し慎重に議論すべきだったと思います。もっと大事である適用すべき領域のことを一切冠していないことが、もっとも致命的なので。はっきりいって、そのもっとも大事な適用領域の議論をボヤかして「今後もっとも食えるセクシーな職業」なんて某米国大手企業のニーズでしかなかったものをどこでも通用するかのように嘘くさいヨイショされたのが最大の過ち。ソフトウェアの創造より、活用を重視する、つまり分析をメインにしたデータ土方でしかない職業が、他の職よりセクシーなわけがない。
 
一方、サイエンティストならば詳しい専門の領域を持っているものです。なぜなら、そこで研究をしてサイエンティストになった(なろうとしている)からです。だから薬学の科学者が、金融の科学者にはすぐにはなれない。薬学とバイオだって近いようでまったく遠い別な世界。適用領域の溝は相当に深いのは自明なわけですよ。そして、その領域で通じるやり方と知見を持っている。共通で使えるスキルもあれば、そこでしか通じないスキルもある。どちらかというと後者のほうが多い。なので、たまに物理学者が金融界で活躍する(そういえばエコノフィジックス・・・も久しいな)ような場合は珍しく貴重だったりするわけです。
 
つまり、意味ある資格とは、参入障壁と適用領域について立脚しています。弁護士なら法律、弁理士なら特許、ライフプランナーなら生活設計、Java技術者ならJavaTOEFLなら英会話、珠算ならそろばん・・・、だから適用領域に立脚しない資格は、ほとんど意味をなさない。なぜなら実力の証明にはならないから。ITやWEBはそれ自体は広範囲に適用できるがゆえに、それ単体では何にもならないのです。国のIT施策の大きな失敗の一つは情報処理技術者試験でしょうね。もはや実力の保証にもならないわりに多大なコストかけすぎる。それこそ海外にまるで通じない独自規格の悪癖。その証拠にエンジニアなら自分の作ったITシステムやWebサービスを説明したほうが遥かに実力が伝わりますよね。転職するなら、持っている資格を語るより、自分のやってきたことを切々と語るほうがいいわけです。
 
つまり(ビジネス領域)データサイエンティストなら、まだ成立します。例えば、Webアクセスログサイエンティスト、POSレジデータサイエンティスト、CRMシステムデータサイエンティスト、臨床実験データサイエンティスト、株取引データサイエンティスト、住宅アンケートデータサイエンティスト・・・うう、どれも言い方がいまいち・・・だから株式だとクォンツとか洒落た名前つけたりするのか。
 
例えばWebアクセスログと臨床実験のデータなんてもう真逆です。前者は無意を含んでひたすら膨大であり、後者は少なすぎるので有意にしたい。データが多すぎるからいかに捨てる集計するかの世界と、データが少なすぎるけど何かを言いたい世界。POSデータは実際に買った後のデータ。広告は買ってくれるかもしれない買う前のデータ。これもまるで違う。財務なら会社の業績をしっかりと、株式なら会社の業績より外の相場を意識しなければ話にならない。これもまた違うわけです。なのに能力も時間もリソースも有限という、とてもとてもセクシーなんて言えない小さく可哀想な職業。
 
で、これら適用領域のことを無視してスキル要件を統合して資格にするなんて無理ゲーなんですよ。そういうことするから手段と道具の話しかできなくなる。手段が目的化して、本当の目的が消える。どういう形式のデータを蓄積すべきか?なんの分析ツール使うべきか?集計方法は?分析手法は?こんな議論はそもそも分析したい領域や前提が決まっていなければ不毛なんです。用意できるINPUTデータと、得たいOUTPUTの目的で変わるに決まっているでしょう。なのにスキル要件なんて定義するだけ無意味ですよ。野球選手は全員バットとグローブ使う。けどウマヘタは試合実績、まさに野球のデータでしか語れないんですよ。バットとグローブの議論してどうするの。野球というデータで語るべきです。身近な例でも、利用料高いシステムトレード専用ツール使ってる友人より、EXCELだけ使ってる爺さんのほうが圧倒的にいい成績だったりします。
 
ビジネスで大事なのは結果であり、収益やロイヤリティであり、スキル要件、資格じゃないんですよ。
サイエンスで大事なのも知見であり、新規性や普遍性であり、スキル要件、資格じゃないんですよ。
 
だからデータサイエンティストなるもののスキル定義や資格なんて必要ないと思うんですよね。
文句ばかりでほんとごめんなさいね。
 
 
 
 
関連記事もよろしければどうぞ。特に現場の第一人者、id:tjoさんの記事は、私の上記いちゃもんを完璧に対処、理解し、発展させてるという力量を堪能できます。私と違って「仕事が前向きに進みそう」感を与えてくれます。定義できませんけど、これこそデータサイエンティストを超える必須要件でしょう。おそれいりました。
 
データサイエンティストの要件は「資格」ではなく「人材(像)」本位であるべき
 
ついでに データサイエンティストがこれから10年以内に消える理由3つ