読者です 読者をやめる 読者になる 読者になる

ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

データ分析する人が、なぜデータサイエンティストと呼ばれたくないのか 

※コラ画像削除しました

 

ビッグデータ、データサイエンティスト、そろそろ過渡期ブームも終わりつつあるように見えてきたのは結構なことです。なので私はデータベース・トンガリストに鞍替えします。嘘です。行けませんでしたがマニアックなDB話を聞きたかったです。

 

どっちにしても普通に粛々とやるしかないんすから騒いでも絶望しても仕方ないんですよ。実務してない奴ほど騒ぐもの。(←非常に見識の狭いダメ発言)

 

日頃、扱っているデータ。それビッグデータでしょ、と言われるだけで、やる気がなくなる昨今。スモールデータでもいい(←それこそが重要ですよね)と思うし、何度も繰り返される、「いままで1ヶ月かかってたデータを1日にしました」とか言う話も、ビッグデータと関係ないんじゃないの、単に多段承認フローというかステークホルダー減らしただけではと思ったりしますよね。逆にそっちのほうがすごいと思うんだけども。

 

で、ビッグデータのビッグってなんなのよ?Wikipediaなどによると

 

市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑な データ集合の集積物を表す用語

 

らしい。

 

それなら、簡単に取り扱えるのならビッグデータじゃないのでは?という素朴な疑問がでてきます。例えば日頃、自分が扱っているデータは100TBくらいです。もちろん刺し身タンポポな大量処理も含むので一概にデータ量だけで比較してはいけませんけれども、著名なデータサイエンティストな方がいじってるデータが10GBくらいで「やべー、Rじゃ、扱えねえよ」とか言ってるくらいだったら、やっぱりビッグデータだの言ってちゃいけないんじゃないのと思うんですよ。いや、それならデータサイエンティストって名乗るほうが違うだろって話かもしれませんけども。普通にアナリスト名乗っていれば、あの人は量より質の人だからねと思われて違和感ないのにね。大量処理できる人ってイメージいらないんじゃないですかね。

 

それはエンジニアの仕事としか思えないですし。サイエンスというには力技が多すぎる感じもして。HadoopJAVAで格闘する前に、いい感じでログ取り込めておけばいいだけなんじゃないんですかねーとかのローテク解決こそ大事だし、分散I/Oやストリーム処理って素晴らしいけれど、それだってインメモリデータベース作ってガンガン処理すれば用なしのケースも多いと思うよというハイテクの解決もありだし。そう思ってしまう根っこには、こんなの昔から、大規模システムがー、ミッションクリティカルがー、とか言ってたことだからです。

 

なので、それを扱うのが、データサイエンティストだとか言われても嬉しくないんですよね。うるせーよ、そんなの前からやっているし、新技術だって渋々だけど試しては苦労して取り込んできたんだよ、それと今の何が違うんだ、遅れてきた再ラベリングしてダサくしてどうするんだ的な感覚がどうしてもあります。(←大変度量の狭い発言ごめんなさい)

 

どうせ米国発&提唱の消えゆくバズワードなんだし、そんなのもので勝手に定義してほしくないのです。ほんと仕事しない人ほど、職掌定義が好きですからね。管理のための管理コストばっかり増やしたがる。それも決まってシステム化できない方向に増やしたがる。定量じゃなくて定性で増やしたがる。たとえ現場の人はそう思っていなくても、ネタほしさに食らいつくメディアが、御用学者が持ち上げてしまうために、時代に消費されて消え去る徒花になってしまうってのもなんだか儚いですね。 

 

ようするに

  

そんなバズワードの消費と衰退とともに、個人のキャリアやスキルの賞味期限すら尽きちゃうかのようでしょう。称号なんてものは。

  

そう呼ばれたくない人の気持ちには、そういうナイーブなところが大きいと思います。セルフブランディングとかそういうことじゃなくて、もっと自己一貫性(分析や論理には必要なことです)に基づいた、かなり業務に内在化したものです。知人によれば、リーン・スタートアップとか頻繁にピボット(方向転換)しようみたいな尻軽っぽい話って、真面目に仕事している人ほど、経営者にそう言われてアホらしいそうです。これと似たようなものです。

 

あっというまに過去の遺跡になってしまったセカンドライフ。その全盛期、その第一人者扱いされて、テレビに出るほど人気のビジネス的にはかなり剛気なおじさんがいました。残念ながらブームの終焉後、彼は体も壊してリアルライフも終わってしまいました。その彼の生前に語ってくれたこととして思い出すのですが、世の中に不必要とされる苦しみを切々と語ってくれました。大変優秀な方でしたが、もう世間は彼をセカンドライフの男としてしか見てくれなくなっていたのです。軽く男泣きして語るその姿に、たまたま居合わせた私も、なんとも居た堪れない空気だったことを覚えています。掲げた看板の不幸かもしれませんが、いろんなメディアで嬉々として語っていたのに、価値の暴落もあっという間でした。

 

そういった栄枯盛衰を見るにつけ、調子の良いときなんてどうでもよくて、調子の悪いときにどうするかを考えるようになりました。人気があるときに寄ってくる人じゃなくて、人気のないときに会ってくれる人を探すようになったり、10人に嫌われても、好きな1人に好かれるにはどうしたらいいかを考えたり。ネガティブすぎるとも言われましたけど、そうでもないのです。自分は自分の視点でデータやデータを通して社会を見ているだけなんです。分析屋ですからね。多数派と同じような視点じゃ存在意義ないんです。

 

ということで、その行く末を予想するには良い材料が落ちています。それはソフトウェアアーキテクトです。その呼び名も、マトリックス・リローデッドあたりの「アーキテクト(設計者)」に使われたりしたあたりが最高潮で、やはり称号が消費されて消えましたよね。そういや新世紀エバンジェリストって肩書はアニメと関係なさそうですね。今でも誰か名乗ってるんですかね。でも、もうアーキテクトに俺はなる!って聞かれないですよね。当時から名刺交換の遭遇率も極端に低かったですけども。

 

ITアーキテクト育成ハンドブック

 

建築業界に右ならえでアーキテクトって職種が生まれました。そして、これが策定されたのが2007。たったの6年前よ。

これら先人の遺産で、栄枯盛衰を味わってみてください。一体なんだったのかと。そして、今のデータサイエンティストの教育ビジネスだ、スキル定義だ、資格化だ、といったビジネスやコミュニティといった組織化の流れがどういう結末を迎えそうか、想いを馳せてみてください。分析屋はデータ、つまり過去に学ぶ者です。大量のサンプルがないのなら少ない事例から濃く学ぶしかないのですし。

 

私は知識労働であるほど、組織化、規格化に手をつけるべきではないと思っています。

 

そんな仕事いらないです。流動性の高い競争社会においては、型にはめて、定義するようになったら、衰退が待っているだけですよ。定義しようとするその枠ですらどんどん変動していくと気付くべきです。一部の法律がそうであって機能していないように、です。だから、優れたエンジニア、分析屋、研究者やら芸術家らを定義できる=量産できると思ったら大間違いです。実体ないのに景気改善したことになる経済と同じ轍を踏んではいけないと思います。経済より人は変わりにくいのでなおさらです。

 

とはいえ、いずれにしても世の中は止まらないでしょうから、ビッグデータもデータサイエンティストも衰退して、次はどういった再ラベル付けがされるのか世俗的には楽しみでもあります。グロース・ハッカーも微妙だし、やっぱりデータベーストンガリスト・・・は違うな。

 

分析屋も、エンジニアも、寿命の長い呼称を求めています。自分の仕事(を続けたいと思っている人なら)と同じように、です。

 

データサイエンティストなんて、データからも、サイエンスからも、どっちから見ても儚そうな呼称、好きじゃないんです。そもそも両端の定義すらないんだから、無理矢理、真ん中に座する概念なんて作って煽らないでほしいところです。データサイエンス言わんでもサイエンスはもともとデータ必須だし、データドリブンマーケティングなんつって、今まではそうじゃなかったの?という話ではないでしょうか。(←やつあたりごめんなさい)

 

文句ばっかり言ってごめんなさいね。