(実務者向け)日本の、データ基盤系エンジニア人数と年収の推定してみた 2014予想
※表が崩れていますが、修正が面倒大人の事情により、そのままにします。ごめんなさい。
年末進行その2。データ編です。どうせ正月ないから今のうちに。前回の「ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例」の続きでしたが、書くと無駄に長くなりすぎる癖がありまして。そろそネタバレ気味に逝きます。
このブログのモチベーションは、データサイエンティストネタ以前に、データ蒐集と社会の可視化が目的でした。重いモノを動かすには体力ですが、軽いモノを動かしてみるには知力が必要です。好奇心と探究心の一環なわけなので暖かい目でお許しください。
すでにわかっている方もいると思いますけども、私の微妙に一貫性のないコンテンツや時勢を無視した唐突な感じは、そうした蒐集と検証目的に沿って8割方、事前に計画してきたものなわけです。といっても計画8割、実行5割で、進捗率4割という、まるで計画通りじゃないのがダメな感じで今後の反省材料です。またいくつかのソーシャルメディアでの無軌道ぶりも、私というより軽めのボットを作って観測した仕業です。
ということで、この1年、私が知りたかったことは、ビッグデータ関連でいえば、
- 各メディアの持つインパクトの実体感
- 潜在マーケット需要(ビッグデータ業界や、データ分析人材需要)
- その手を担ぐ会社の存在の偏り
- データ分析者の存在マップ 分析屋がどこに潜んでいるのか社会ネットワーク
- 関連技術と経済効果
- データ分析要員の待遇改善効果
などです。私のブログは微妙ですけど、その周辺調査などからも、このあたりはよくわかったので目的達成はしたところです。そこで今回は
- 潜在マーケット需要(ビッグデータ業界や、データ分析人材需要)
の亜種として、データ基盤系スキルの使い手人数と大事な待遇=年収帯の推定を行った結果を共有したいと思います。ビッグデータと騒いでいても、実際のエンジニアにとって今後、年収高くなりそうなスキルとはなにか!と米国の需要ベースで推定してみました。調査や導出方法などはかつての記事を参考ください。前回と違うのは、ブログなどによるフィードバックデータを加味したことです。例えば前回より、特定の人間の所属する会社の年収帯を推定するのは容易ですし、そのデータ蒐集と学習により、推定精度を少しは向上させています。選挙予想と似たようなもんですかね。そっちより簡単ですけど世にない感じなったのはいい具合かなと。年収帯の分布を出すことで、ざっくりとスキル熟練度の分布も想像できますが、一人が複数の領域にまたがることは当然ありえます。では共有します。
データベース系
推定年収帯(万円)と推定人数 | ||||||||
従事スキル | 総使い手 (人数) |
平均年収 (万円) |
総給与 (百万円) |
~399 | 400~599 | 600~799 | 800~999 | 1000~ |
Oracle | 45768 | 550 | 251,749 | 24232 | 12349 | 6444 | 1869 | 874 |
SQL Server | 39618 | 529 | 209,668 | 22630 | 10550 | 4755 | 1194 | 490 |
MySQL | 13742 | 542 | 74,428 | 7476 | 3698 | 1858 | 526 | 185 |
MongoDB | 4302 | 748 | 32,194 | 0 | 2161 | 1395 | 443 | 304 |
PostgreSQL | 2295 | 528 | 12,111 | 1348 | 561 | 283 | 76 | 28 |
NoSQL | 6453 | 754 | 48,640 | 0 | 3160 | 2105 | 706 | 482 |
なんだかんだで商用的には2大巨頭のOracle、SQLserverの需要があるので人数も多めです。MongoDBやNoSQLみたいな新技術っぽいのは使い手の人数が少なく短期需要的には高めになりがちです。ただ、このへんは流行らない技術認定されると、急速に消えるので、ヘッジとして普通にRDBもやっておく必要があるでしょうね。それはMySQL、PostgreSQLどれもそんなに大差ありません。年収が高いDBエンジニアは重要なデータ扱う管理者的なポジションでもあるのでオープンソース系よりは、やはり商用DBの比率が高くなるようです。
大量処理界系
推定年収帯(万円)と推定人数 | ||||||||
従事スキル | 総使い手 (人数) |
平均年収 (万円) |
総給与 (百万円) |
~399 | 400~599 | 600~799 | 800~999 | 1000~ |
Hadoop | 8081 | 759 | 61,342 | 0 | 3860 | 2667 | 900 | 654 |
mahout | 431 | 630 | 2,715 | 104 | 218 | 69 | 20 | 20 |
Hive | 2645 | 690 | 18,236 | 552 | 962 | 698 | 259 | 173 |
ビッグデータの申し子な感じのスキルであるHadoopスキル使いは年収高めの傾向ありです。今後もビッグデータブームを経て使い手も増えてくるでしょう。マニアックにmahoutなんか探ってみましたがほとんど使い手いないようです。HiveはDWHの一種ですがHadoop派生なんでHadoopの内数と見てよいでしょう。
分析ソフトウェア系
推定年収帯(万円)と推定人数 | ||||||||
従事スキル | 総使い手 (人数) |
平均年収 (万円) |
総給与 (百万円) |
~399 | 400~599 | 600~799 | 800~999 | 1000~ |
matlab | 4104 | 542 | 22,228 | 2317 | 1019 | 506 | 172 | 89 |
SPSS | 3994 | 587 | 23,466 | 1788 | 1173 | 669 | 226 | 139 |
分析ソフトウェアの使い手たちですが人数はそこそこ。あまり年収高くありません。RやSASは?というのは大人の事情で割愛いたします。この手は類義語も多くてデータ的に蒐集と推定が難しくて。年収低めは学術関係者も使うのでその補正かもしれません。使いこなすと便利なんですがこれもまたブームにより消えがちなスキルなのでMSOFFICE系を使いこなせる必要もあるでしょうね。
マイクロソフトオフィス系
推定年収帯(万円)と推定人数 | ||||||||
従事スキル | 総使い手 (人数) |
平均年収 (万円) |
総給与 (百万円) |
~399 | 400~599 | 600~799 | 800~999 | 1000~ |
microsoft Excel | 182112 | 381 | 694,599 | 133902 | 28678 | 12982 | 3746 | 0 |
microsoft Access | 37509 | 343 | 128,747 | 29159 | 4773 | 1993 | 545 | 0 |
MS系だけ区別しました。もっとも使われる分析ソフトウェア?ことEXCELはやはり使い手数は最大です。年収はポピュラーすぎて差別化難しいので低めになってしまいます。Accessも同様です。能力の差別化要素にはなりづらくても英語より重要な汎用スキルなのでやらざるをえませんけどもね。
クラウドサービス専門系
推定年収帯(万円)と推定人数 | ||||||||
従事スキル | 総使い手 (人数) |
平均年収 (万円) |
総給与 (百万円) |
~399 | 400~599 | 600~799 | 800~999 | 1000~ |
Amazon EC2 | 1536 | 555 | 851,915 | 766 | 463 | 222 | 60 | 25 |
microsoft Azure | 1161 | 520 | 603,612 | 707 | 266 | 144 | 32 | 11 |
AmazonEC2やAzureのスキル(に特化した)使い手はまだまだ少ないようです。他のエンジニアスキルが応用が効くので特化する必要はないかもしれません。また登場した時期からしてエンジニア自体の年齢が低めと予想できることから年収は低めに見えます。
おまけ スマホ開発系
推定年収帯(万円)と推定人数 | ||||||||
従事スキル | 総使い手 (人数) |
平均年収 (万円) |
総給与 (百万円) |
~399 | 400~599 | 600~799 | 800~999 | 1000~ |
iOS | 19817 | 597 | 11,825,062 | 7899 | 6396 | 3938 | 1115 | 469 |
iOS developer | 4572 | 552 | 2,521,651 | 2367 | 1263 | 685 | 196 | 61 |
Android | 19662 | 602 | 11,846,094 | 7742 | 6268 | 3891 | 1190 | 572 |
Android developer | 4864 | 551 | 2,681,452 | 2519 | 1354 | 714 | 208 | 68 |
iOSとAndroidのエンジニア延べ数も調べてみました。またdeveloperと付くのは内数で専用の開発者達です。これはこれで独特の開発スタイルと言語なので平均的には若いはずですが、ソーシャルゲームが下火になっても年収の高さから今後ますます需要はありそうです。
細かいことは言えばきりないですので、データと数値で感じて、参考にいただければと思います。ということでデータ系スキルの年収ランキング(需要ベース予想)では
1位 Hadoop
2位 MongoDB
3位 NoSQL
となりました。もろに昨今の流行を反映していますね。といっても人数少ないスキルは水物ですので、ヘッジの意味では、しっかりとポピュラーなRDBMSやEXCELなんかをきっちりやっておく必要があるでしょう。すみません。MongDBってNoSQLの内数ですね。ご指摘ありがとうございました。
年末ですから、余計なお世話な感じですが、あなたのいる場所と存在の希少確率なんかを振り返ってみたりと、お役に立てれば幸いです。
どうもありがとうございました。
次は組織編の予定です。
こちらもどうぞ。
ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例
http://negative.hateblo.jp/entry/2013/12/17/180022
年末進行その1。ビジネスやっているとなかなか書きたいことが書けないけどなんとか。
類似調査 調査方法や考え方はこちら
データ分析人材の年収分布を推定してみる (ビッグデータ人材の推定その2)
http://negative.hateblo.jp/entry/2013/08/20/154139
日本のビッグデータ関連の技術者数を推定してみる
http://negative.hateblo.jp/entry/2013/08/15/154627
当時よりもデータ蒐集できてレベルアップして、見えないところも見えるようになりました。もっと書きたいところだけれど、そうすると本業にしている領域がどんどん近づいてくるのが悩ましいです。