読者です 読者をやめる 読者になる 読者になる

ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

データ分析人材の年収分布を推定してみる (ビッグデータ人材の推定その2)

 お盆に職種の人口動態を調査してはみたものの、そもそもマクロ指標なんて普通の人には興味ないテーマだった・・・と気づき、微妙な気分でまたブログ書きます。昔から人口動態などを気にするのは、個人を超越しつつある為政者や経営者の類であり、組織運営のビジョンを持つ方くらいしか用のないテーマだと相場も教えてくれていたのに。それゆえにマクロ経済は人気がなくても滅びないわけですが、って関係ない話だな。

で、私も本業の本業になってくると、ネットもろくにできない情報統制の厳しいところだったりして。ほんと、その鬱憤たるや凄まじく、数々の優秀な技術者がボーナスもらって有給きっちり使い切ってから逃げ出すほどです。だから私は最近は分析屋の知人のインフラを借りてWEBサービス作って遊んだり、このブログに微妙な気分を書き残そうかと思ったりしています。

ということで、懲りずに続けてみるわけです。

 

問 日本のデータ分析人材の人数と年収分布を推定してみる

 

お題はこれ。

データサイエンティスト -今後10年「食える仕事」ナンバーワン(PRESIDENT 2013年4月1日号)

http://president.jp/articles/-/8818

とあるとおりで、それならば就労としても魅力が高いはず。(私には奇妙に見えてしまうのですが)お約束の人材不足も叫ばれている昨今であれば、需要もあり、年収も高いはずです。しかし、果たして本当にそうでしょうか?

ということで今回も調べてみるわけです。前回、米国の比率を日本向けに補正した推定を行い、人数をざっくり推定してみました。前回で技術者数は推定できたので、今回はそれをさらに年収で細分化してみます。

今回は試算方法も簡単。前回クロールしたデータの提示年収を集計(前回の試算方法3)し、その分布比率を、それを日本の技術者数(前回の試算方法9)にかけるだけです。ようするにクロール時に提示年収を抜いておいて別集計しただけです。それと今の相場を反映してざっくり1ドル=100円の計算なのと、知識労働職の給与が日本は米国の2/3くらいなのでそこを補正しておきます。例によって米国の比率を日本に適用しているので若干偏りはありますし、もちろん異論は認めまくります。また数字の桁やグラフの扱いとか本来と違ってふさわしくない用い方だったりしますが手間とブログのスペース都合とかだったりするのでそこらへんも暖かい目で容赦ください。

 

 

調査結果 日本のデータ分析人材の人数と年収分布の推定

 

ということで人数は前回と変わりません。そこにデータ分析系の年収分布で内訳をつけてみます。

 

  推定

内訳 年収推定

(万円)

     
職種 技術者数 ~399 400~599 600~799 800~999 1000~
データサイエンティスト 9,025 4,495 2,587 1,149 557 237
アナリスト、コンサルタント 73,711 41,174 19,005 8,631 3,538 1,363
ビジネス企画、事業開発 100,959 55,245 26,405 12,196 5,132 1,981
データマイニング技術者 10,656 5,371 2,719 1,514 750 302
Webアクセス解析 18,091 8,777 4,697 2,748 1,325 543

 

表1 データ分析系の年収分布(推定)

 

米国の比率を適用しましたが遅かれ早かれ日本も似たようなものだと思えば、なかなか妥当に見えます。答え合わせとして別職種で推定した結果を、私の知る大手の人材DBと照らし合わせても遠からず当てはまりは悪くありませんでした。これを見ると1000万プレーヤーはまだ少ないですね。データサイエンティストでも2.63%くらいでしかない。それより大手のコンサルやアナリストが高給が多いのがよくわかる分布です。

 

 

内訳 年収推定

(万円)

     
職種 ~399 400~599 600~799 800~999 1000~
データサイエンティスト 49.81% 28.66% 12.73% 6.17% 2.63%
アナリスト、コンサルタント 55.86% 25.78% 11.71% 4.80% 1.85%
ビジネス企画、事業開発 54.72% 26.15% 12.08% 5.08% 1.96%
データマイニング技術者 50.40% 25.52% 14.21% 7.04% 2.83%
Webアクセス解析 48.52% 25.97% 15.19% 7.32% 3.00%

 

表2 データ分析系の年収分布比率(推定)

 

しかし比率で見るとアナリストやコンサルは低いことがわかります。データサイエンティストのほうが高給である比率が少し高そうです。Webアクセス解析は、Webアクセス解析の業者やネット広告事業者も含んでおり(=人件費が高騰している業界でもあり)相対的に高くなりがちですが、そこは分離が難しいのでご容赦ください。年収600万超なら上位20%に、年収年収1000万を超えているとデータ分析屋の上位2%に入っていることになりますね。もちろん定年を迎える人も少ない若い職種だから(年収高い人も意外に少ない)というバイアスも受けているでしょう。

次にデータ入力、データ管理設計系の年収分布を見てみます。

 

  推定

内訳 年収推定

(万円)

     
職種 技術者数 ~399 400~599 600~799 800~999 1000~
データ入力、オペレータ含 90356 81090 5582 2553 1131 0
データベース管理者 15562 8177 4266 2084 783 252
データベース設計 21146 2647 8090 5530 3204 1675

 

表3 データ入力、データ管理設計系の年収分布(推定)

 

 

内訳 年収推定

(万円)

     
職種 ~399 400~599 600~799 800~999 1000~
データ入力、オペレータ含 89.75% 6.18% 2.83% 1.25% 0.00%
データベース管理者 52.54% 27.41% 13.39% 5.03% 1.62%
データベース設計 12.52% 38.26% 26.15% 15.15% 7.92%

 

表4 データ入力、データ管理設計系の年収分布比率(推定)

 

ここではデータ入力、オペレータの人数に対して年収分布が比較的低いこと、逆にデータベース設計の年収分布が比較的高いです。ビッグデータがバズっていたところでデータはやはりデータベースに蓄積されていくものであり、今後も重要なので、きちんとデータベース設計できる人は価値が高いと思われます。米国ではBESTJOB2012に入っているデータベース管理者はデータ分析系より若干、年収が低めな感じです。またデータ入力やオペレータはさすがに1000万プレーヤーはいなくなっています。次にこの比率を比較してみます。

 

 

f:id:dsca:20130820040812j:plain

 

図1 ビッグデータ関連職種の年収(比率)曲線

 

データ分析系が職種は違えど概ね似た年収曲線であることがわかります。まるで別のクロールデータなのに不思議と一致しており、データサイエンティストとデータマイニング屋の差がよくわからないように、ほとんど分布に差がないことがわかります。Webアクセス解析(業者やネット広告業者)も同じような曲線になるなんて、不思議なもんですね。一方、データベースの熟練を要する設計は必然と高給になり、データ入力やオペレータは低い感じで、設計管理人材は年季が立って年収に差がついている格差社会なのもわかります。

 

 

まとめ

 

ということでデータ分析人材は比較的高給だとわかりました。データサイエンティストは年収1000万以上の存在比率が3位/8職種中と良くも悪くもない感じでした。ということで今後もっとも食える職業かどうかは疑わしくもわかりません。それよりデータベース設計とWebアクセス解析が高給そうですね。最後に人数と年収分布をサマリして人件費の割合を出してみましょう。

 

 

f:id:dsca:20130820040826j:plain

 

図2 ビッグデータ関連の人件費の総割合(単位:100万円)

 

正確には人件費とちょっと違いますが、年収×人数の総合計も出しておきます。うーむ。国内のデータサイエンティストを全員抱えたければ500億円/年の給与を支払うのか。ちょっと無理だわ。(←ちょっとどころか無謀な発言)10万人のコンサルタント全軍団だと5000億/年。この規模なら、だいたいそんなところでしょう。

 

で、なんかネガティブなこと言わなきゃな・・・と思ったんですが頭が定量&真面目脳になってるので特にないんだな、これが。システムエンジニアやソフトウェア開発、WEB開発、デザイナーなどは、そのうち別な機会にやってみます。

 

なお聞いた話ではニューヨークの金融がらみのデータサイエンティストの年収相場は$95,000(今の相場ならざっくり950万円)だそうです。よーし、ちょっとニューヨーク行ってくるわ!(←無謀な発言)

  

今回も適当な推定してごめんなさいね。マクロな視点を持つ方の参考になれば幸いです。

 

関連記事

 

本記事はこの記事の続きです。その1

日本のビッグデータ関連の技術者数を推定してみる データサイエンティストは9000人くらい

http://negative.hateblo.jp/entry/2013/08/15/154627

推定方法などはこっちを参考に。単に米国転職サイトをクロールしまくっただけですが。

 

 

本記事も、この記事へのオマージュです。

データサイエンティストは精鋭の6000人しか要らないかもしれない

http://tjo.hatenablog.com/entry/2013/08/09/201732

 

ついでに

データサイエンティストが要らない日はもう来ている ver2

http://negative.hateblo.jp/entry/2013/08/08/171314