ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

(実務者向け)日本の、データ基盤系エンジニア人数と年収の推定してみた 2014予想

※表が崩れていますが、修正が面倒大人の事情により、そのままにします。ごめんなさい。

 

年末進行その2。データ編です。どうせ正月ないから今のうちに。前回の「ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例」の続きでしたが、書くと無駄に長くなりすぎる癖がありまして。そろそネタバレ気味に逝きます。

 

このブログのモチベーションは、データサイエンティストネタ以前に、データ蒐集と社会の可視化が目的でした。重いモノを動かすには体力ですが、軽いモノを動かしてみるには知力が必要です。好奇心と探究心の一環なわけなので暖かい目でお許しください。

 

すでにわかっている方もいると思いますけども、私の微妙に一貫性のないコンテンツや時勢を無視した唐突な感じは、そうした蒐集と検証目的に沿って8割方、事前に計画してきたものなわけです。といっても計画8割、実行5割で、進捗率4割という、まるで計画通りじゃないのがダメな感じで今後の反省材料です。またいくつかのソーシャルメディアでの無軌道ぶりも、私というより軽めのボットを作って観測した仕業です。

 

ということで、この1年、私が知りたかったことは、ビッグデータ関連でいえば、

 

  • 各メディアの持つインパクトの実体感
  • 潜在マーケット需要(ビッグデータ業界や、データ分析人材需要)
  • その手を担ぐ会社の存在の偏り
  • データ分析者の存在マップ 分析屋がどこに潜んでいるのか社会ネットワーク
  • 関連技術と経済効果
  • データ分析要員の待遇改善効果

 

などです。私のブログは微妙ですけど、その周辺調査などからも、このあたりはよくわかったので目的達成はしたところです。そこで今回は

 

  • 潜在マーケット需要(ビッグデータ業界や、データ分析人材需要)

 

の亜種として、データ基盤系スキルの使い手人数と大事な待遇=年収帯の推定を行った結果を共有したいと思います。ビッグデータと騒いでいても、実際のエンジニアにとって今後、年収高くなりそうなスキルとはなにか!と米国の需要ベースで推定してみました。調査や導出方法などはかつての記事を参考ください。前回と違うのは、ブログなどによるフィードバックデータを加味したことです。例えば前回より、特定の人間の所属する会社の年収帯を推定するのは容易ですし、そのデータ蒐集と学習により、推定精度を少しは向上させています。選挙予想と似たようなもんですかね。そっちより簡単ですけど世にない感じなったのはいい具合かなと。年収帯の分布を出すことで、ざっくりとスキル熟練度の分布も想像できますが、一人が複数の領域にまたがることは当然ありえます。では共有します。

 

データベース系 

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
Oracle 45768 550 251,749 24232 12349 6444 1869 874
SQL Server 39618 529 209,668 22630 10550 4755 1194 490
MySQL 13742 542 74,428 7476 3698 1858 526 185
MongoDB 4302 748 32,194 0 2161 1395 443 304
PostgreSQL 2295 528 12,111 1348 561 283 76 28
NoSQL 6453 754 48,640 0 3160 2105 706 482

 

なんだかんだで商用的には2大巨頭のOracleSQLserverの需要があるので人数も多めです。MongoDBやNoSQLみたいな新技術っぽいのは使い手の人数が少なく短期需要的には高めになりがちです。ただ、このへんは流行らない技術認定されると、急速に消えるので、ヘッジとして普通にRDBもやっておく必要があるでしょうね。それはMySQLPostgreSQLどれもそんなに大差ありません。年収が高いDBエンジニアは重要なデータ扱う管理者的なポジションでもあるのでオープンソース系よりは、やはり商用DBの比率が高くなるようです。

 

 大量処理界系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
Hadoop 8081 759 61,342 0 3860 2667 900 654
mahout 431 630 2,715 104 218 69 20 20
Hive 2645 690 18,236 552 962 698 259 173

 

ビッグデータの申し子な感じのスキルであるHadoopスキル使いは年収高めの傾向ありです。今後もビッグデータブームを経て使い手も増えてくるでしょう。マニアックにmahoutなんか探ってみましたがほとんど使い手いないようです。HiveはDWHの一種ですがHadoop派生なんでHadoopの内数と見てよいでしょう。

 

分析ソフトウェア系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
matlab 4104 542 22,228 2317 1019 506 172 89
SPSS 3994 587 23,466 1788 1173 669 226 139

 

分析ソフトウェアの使い手たちですが人数はそこそこ。あまり年収高くありません。RやSASは?というのは大人の事情で割愛いたします。この手は類義語も多くてデータ的に蒐集と推定が難しくて。年収低めは学術関係者も使うのでその補正かもしれません。使いこなすと便利なんですがこれもまたブームにより消えがちなスキルなのでMSOFFICE系を使いこなせる必要もあるでしょうね。

 

マイクロソフトオフィス系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
microsoft Excel 182112 381 694,599 133902 28678 12982 3746 0
microsoft Access 37509 343 128,747 29159 4773 1993 545 0

 

MS系だけ区別しました。もっとも使われる分析ソフトウェア?ことEXCELはやはり使い手数は最大です。年収はポピュラーすぎて差別化難しいので低めになってしまいます。Accessも同様です。能力の差別化要素にはなりづらくても英語より重要な汎用スキルなのでやらざるをえませんけどもね。

 

クラウドサービス専門系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
Amazon EC2 1536 555 851,915 766 463 222 60 25
microsoft Azure 1161 520 603,612 707 266 144 32 11

 

 AmazonEC2やAzureのスキル(に特化した)使い手はまだまだ少ないようです。他のエンジニアスキルが応用が効くので特化する必要はないかもしれません。また登場した時期からしてエンジニア自体の年齢が低めと予想できることから年収は低めに見えます。

 

おまけ スマホ開発系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
iOS 19817 597 11,825,062 7899 6396 3938 1115 469
iOS developer 4572 552 2,521,651 2367 1263 685 196 61
Android 19662 602 11,846,094 7742 6268 3891 1190 572
Android developer 4864 551 2,681,452 2519 1354 714 208 68

 

iOSAndroidのエンジニア延べ数も調べてみました。またdeveloperと付くのは内数で専用の開発者達です。これはこれで独特の開発スタイルと言語なので平均的には若いはずですが、ソーシャルゲームが下火になっても年収の高さから今後ますます需要はありそうです。

 

 

 

細かいことは言えばきりないですので、データと数値で感じて、参考にいただければと思います。ということでデータ系スキルの年収ランキング(需要ベース予想)では

 

1位 Hadoop

2位 MongoDB

3位 NoSQL

 

となりました。もろに昨今の流行を反映していますね。といっても人数少ないスキルは水物ですので、ヘッジの意味では、しっかりとポピュラーなRDBMSやEXCELなんかをきっちりやっておく必要があるでしょう。すみません。MongDBってNoSQLの内数ですね。ご指摘ありがとうございました。

年末ですから、余計なお世話な感じですが、あなたのいる場所と存在の希少確率なんかを振り返ってみたりと、お役に立てれば幸いです。

 

どうもありがとうございました。

 

 

次は組織編の予定です。

 

 

こちらもどうぞ。

 

ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例

http://negative.hateblo.jp/entry/2013/12/17/180022

年末進行その1。ビジネスやっているとなかなか書きたいことが書けないけどなんとか。

 

 

類似調査 調査方法や考え方はこちら

 

データ分析人材の年収分布を推定してみる (ビッグデータ人材の推定その2)

http://negative.hateblo.jp/entry/2013/08/20/154139

日本のビッグデータ関連の技術者数を推定してみる

http://negative.hateblo.jp/entry/2013/08/15/154627

 

当時よりもデータ蒐集できてレベルアップして、見えないところも見えるようになりました。もっと書きたいところだけれど、そうすると本業にしている領域がどんどん近づいてくるのが悩ましいです。