ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

日本のビッグデータ関連の技術者数を推定してみる データサイエンティストは9000人くらい

最近、酔っ払って書いてんじゃないのという暖かい叱咤激励もいただいたことですし、たまに覚醒してブログ書きます。お盆で親戚子供の相手も疲れてきたし、TBS「リアル脱出ゲームTV Sky High」でランキング入ってたみたいなんで、少し色気だしてみましょう。 

分析屋たるもの、大本営数値を鵜呑みにするわけにはいかない。TV屋や新聞屋の25万人説はどうにも嘘くさい。データサイエンティストのスキル要件は定義できない(持論)けど、あえて言うなら「世間に流されず自らデータを創造できる」人ではないかと。いや、そういってしまうと偽造や捏造くさいからあかんか・・・。ともかく自分で検証してみるかと思ったわけです。

 

問 日本のビッグデータ関連の技術者数を推定してみる

 

ということで今をときめくビッグデータ関連技術者数を推定してみましょう。お題はいつものこれ。

ビッグデータ分析に人材の壁、25万人不足見通し

http://www.nikkei.com/article/DGXNZO57421630X10C13A7EA1000/

そんなにいらんでしょうよと直感では文句言ってきた(持論)のですが、ならばざっくりでも、どれくらい人数いそうなのさ、データないので自分で推定してみましょう。

 

調査結果 日本のビッグデータ関連技術者数の推定

 

f:id:dsca:20130817003233j:plain

 

米国&日本の雇用統計などを基に日本国内のビッグデータ関連技術者は2014~2015あたりこれくらいと推定できました。異論は認めまくります。米国の需要ベースから日本の割合に適用してみた&昨今のバズワード(ビッグデータ、データサイエンティスト)ブームなどで2014~2015くらいに需給バランスが追い付いてきた(米国化してきた)場合という想定です。調査方法は一番下読んで。

 

 データ分析系

  

Job title 日本向けの超訳 日本の技術者数(推定)
data scientist データサイエンティスト 9025
data analyst データアナリスト、コンサルタント 73711
business analyst ビジネス企画、事業開発 100959
data mining データマイニング技術者 10656
web analytics Webアクセス解析 18091

 

 データサイエンティストは直近の需要ベースで考えれば9000人あたりでしょう。現在は全体の1%弱くらい。25万人説は却下ですね。言いだしっぺの米国でも同業種に比べ求人が少ないです。まあ最近、新たに新造された職種ですしね。これはid:tjoさんのフェルミ推定(シビアめに6000人とおいていることから)と楽観的に同程度かと。米国ではデータアナリストのほうが知名度獲得している影響で、日本推定でも多くなっていますが、実際のところ、「アドホック」な分析屋の数はこちらのほうでしょう。大量計算できない人も多いですし。さらに企画や事業開発系の方になってくるとさらに多い。このへんは米国でも技術者ではない人、MBAとかも含んでるっぽいです。このタイプは人使い荒そう。オマケでデータマイニングだけやってくれ職としてデータマイニング技術者も探してみました。こっちはアドホックな分析できない人も多いでしょう。これは大量計算や「アルゴリズム」や「アカデミック」な感じですかね。さらなるオマケとして、日本だとWeb解析士とかファンタジーっぽい称号とかありますが、ビッグデータといえばWebアクセス解析なのでそちらも推定してみました。この中には米国ではネット広告運用の最適などやっている人も含まれています。このへんがビッグデータ関連職かね・・・・あれ?足すと21万人。募集職種なので重複ありとしても、25万人まであと少し!(苦笑)

 

 データ入力、管理設計系

 

Job title 超訳 日本の技術者数(推定)
data entry データ入力、オペレータ含 90356
database administrator データベース管理者 15562
data architect データベース設計 21146

 

 データ分析屋を支える土台を作る力持ちの職種。しっかり構築するからしっかり分析できる。この人達こそ、分析しないとしてもビッグデータを扱う中核なのに人材足りないとならないのはなぜだ。データ入力やオペレータが、データ爆発を人数で食い止めているので人数多くなっているようです。効率化できるデータベース管理者より新規需要を含む設計者のほうが多くなりそうですね。昔のバズワードなアーキテクトという言葉も定着。

 

 システム開発系

  

Job title 超訳 日本の技術者数(推定)
systems engineer システムエンジニア 149831
software engineer ソフトウェア開発者 96506
software architect ソフトウェア設計 27618

 

比較用に。データ関連と重複もあると思います。2010年のBESTJOBなシステムエンジニア関連ですが、システム構築という意味ではまさに価値創造職です。でも、いろんな案件みているとSEこそ万年、人材不足に見えるのはなぜですかね。分析屋だけふくらんでも実装できない人が増えて頭でっかちになりそうなのでシステム開発の人がもっと増えてほしいです。

 

WEB制作系

 

Job title 超訳 日本の技術者数(推定)
web developer WEB開発 55706
web design WEBデザイン、絵師 103512
web marketing WEBマーケッター 40267

 

比較用に。日本だとおよそ20万人くらいのコミュニティというところ。WEB界隈は、硬直性の高いSI業に比べて流動性も高く、エグい投資家や悪いメディアが自由を焚き付けるせいで微妙にオサレ風だったりと極端な生態系(←ダメな偏見)だったりしますが、米国のデータを基にするとデザイナーがあふれている感じです。グラフィックデザイナーやデジタル絵師とかも含まれ、ちょっと分離しにくいのでご容赦ください。

 

インフラ、サポート系

 

Job title 超訳 日本の技術者数(推定)
network engineer インフラエンジニア(ネットワーク) 42402
hardware engineer インフラエンジニア(サーバー) 37052
support engineer  カスタマーサポート 116189

 

最強の職業ことインフラエンジニア関連です。これまた20万人くらい。明らかに他と異なるスキルが要求されますので重複なしと見なしてもよさそうです。かつてJAVAが流行ってC++ができなくなったようにインフラでもきちんとオンプレミスでネットワーク設計やサーバー構築できる人がどんどん減ってきているようですが、流行に乗ってサーバーだけ増え続ければ今後も市場価値は高いでしょう。

 

技術系経営職

 

Job title 超訳 日本の技術者数(推定)
cio 最高情報責任者 4735
cto 最高技術責任者 3878
ceo 最高経営責任者 68218

 

おまけ。IT&WEB系の会社にざっくり限定して調べてみました。CIOやCTOは少ないのは募集が少ないからですね。生え抜き&たたき上げの技術者とかがなる感じ。このへんまで来ると今回のやり方では偏ります。ちなみにCAO(最高分析責任者)はレアすぎて見つからず。それなりの規模じゃないと技術系役員とかって募集しないから妥当でしょうか。小さくても1会社1CEOは存在する=交代させられるので結構な数がいる感じに見えます。

 

まとめ

 

分析関連の職の人数を適当に推定してみました。およそ21万人くらいですね。数値の信ぴょう性は適当ですが、コンサルもアナリストもみんなビッグデータ人材(とかデータサイエンティスト)なことにして、細かいことはいいんだよと合算しちゃえば25万人目指せそう・・・・とてもバカバカしいですね。自分がやっといてアレなんですが、大本営な感じで、その後、25万人を達成した!なんて言ったところで、もともと存在する人数の付け替えでなんとでもなるということですね。

メディアは、ひたすらビッグデータ関連の人材不足を叫んで煽っています。彼らは少し昔は、高度IT人材が不足するから大変だと繰り返し連呼してました。いいかげん、バズワードに踊らされずに、ないものねだり【無い物強請り】だと気づきましょう問題が高度化して専門化しているから、何が起きるかわからない人間ほど不安になっているだけだと。戦争なくすには、勝つには、もっと人間が必要だと言ってるのと同じレベルですよ。ぶっちゃけ、どんな時代でもどんな問題解決にも人間が必要ってだけ。今度はあいつらに注目して掻き回せってだけ。ラベルだけ張りかえて、不足と渇望だけを繰り返す報道。その結果、何が起きるかわかっていない短期視点な有識者。一朝一夕に人材なんて育ちません官も学も人材育成で成功した試しが今までありましたか(あったらごめんなさい)。ないものは突然あらわれず、あるものが変わっていくだけです。当分、少子高齢化なんですし、今いる人材を大事にして、替えの効かない人材に磨き上げていってほしいところです。

 

■(参考)試算方法

1 ざっと見て日本にデータはまったくない。よく25万人とか言えますね?(←シツコイ)なら言いだしっぺの米国だ。

2 米国でも微妙な情報しかない。じゃあ米国の人材募集(転職)を見れば需要はわかるはず。そこから日本を考えてみよう。

3 米国系有名転職サイトらにクローリングする。迷惑かけない程度にやりました。ごめんなさい。※日本のサイトやると100%怒られそうでもありまして。 

進撃の巨人を読んだことない人がデータだけでキャラを推測してみる

http://d.hatena.ne.jp/AntiBayesian/20130804/p1

ではPixvでしたが、ここでは米国系大手転職求人サイト(わかる人にはわかると思いますが、一部伏字にさせてください。)http://www.m__ster.com/ http://www.c__eerbuilder.com/ http://www.d__e.com/  http://www.i__eed.com/ に職種名や地域にて(サイトに迷惑かけない程度にWaitさせて)クロール開始。まったり寝かします。 

4 寝かしている間に母集団を調査します。つまり米国と日本のIT技術者数です。IPA「グローバル化を支えるIT人材確保・育成施策に関する調査」2011年 P23と前回の記事ネタ(BEST JOB)から成長率を補正して2013年現在、米国357万人、日本111万人と概算します。  

5 4から得られた各職種毎の求人数からビッグデータ系の母数の多い(例 システムエンジニア)or知りたい職種(例 データサイエンティスト)の求人数を抜きだします。

6 少々飛躍しますが、これが現在の米国のビッグデータ系職業の需要を表しているとすると、遠からず供給(現状の実態)が追いついてくる(自称するなり転職するなり)と考えられます。そこで2014年と少し未来のこととしています。で、350万人に同比率で存在すると仮定して数値を補正します。 

7 これでとりあえずの米国の2014年の米国IT技術者数が推定できました。 

8 検証1 いくつかの情報と照らし合わせます。例えば

http://www.ovta.or.jp/info/northamerica/unitedstates/06labor.html

コンピュータ開発者数は90万人→4年後の成長率補正で131万人。こちらの推定は139万人。いい加減ながら、米国ではなかなか良い塩梅。(だと思わせてください!頼む) 

9 これを日本向けに補正します。4より日本は米国の3割程度しかIT技術者がいないので。 

10 プログラムのデータとり方が崩れたり、元データが微妙だったりなところを少しだけお化粧&整形して出来上がり。

 

って超簡単に言えば、米国の求人数を母集団に需要ベースの就労者分布だしてそれを日本の母集団に適用してみただけです。お盆中にくだらないことやりやがってと暖かい眼差しでどうぞご笑覧ください。 今回は特に、米国転職者サイトさま、ゆっくりクローリングしてすみませんでした。異論は認めまくります。適当な推定してごめんなさいね。

 

data scientist  
5 data scientist求人数 (2013.8) 約16085人
6 5は求人数全体に占めるのは 約0.832%
7 米国全体のdata scientist(需要ベース) 約29114人
9 人口補正して日本全体のdata scientist 約9025人

 

関連記事

本記事はこの記事へのオマージュです。

データサイエンティストは精鋭の6000人しか要らないかもしれない

http://tjo.hatenablog.com/entry/2013/08/09/201732

 

続きはこちら

データ分析人材の年収分布を推定してみる (ビッグデータ人材の推定その2)

http://negative.hateblo.jp/entry/2013/08/20/154139