ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例

f:id:dsca:20131217182717j:plain

 

師走ですから軽く総括気味に。ブログやってみてわかったことをまとめておきます。もちろん話せる範囲ということでご勘弁ください。

 

データサイエンティスト界隈といってもほとんどソーシャルゲームとネット広告あたりの人っぽい

 

私の記事に反応してくれた人の傾向を常に調べています。というと気持ち悪くてごめんなさいね。別に何もしていませんけれど、職業などが分かる場合は、どういう人かくらいは見させてもらっています。といっても人力ではありません。私のソーシャルでの動きは無軌道のように見えてごめんなさいね。そのとおり。ボット作ってデータ集めています。で、それらの肩書傾向をまとめるとおおまかには

 

18.67% 情報サービス、システム開発やってるっぽい人

14.77% ネット広告やってるっぽい人

12.35% ソーシャルゲーム作ってるっぽい人

11.22% 学生

 9.64%  教育関係者

 7.58%  プログラマーっぽい人

・・・

 

になります。データサイエンティスト釣り堀として見ても、だいぶ業種が固定化されていますね。特定の連中だけが熱くて周囲は冷えている日本の業界事情に近しい感じです。やはりサイエンティストとか普遍的な称号いらなくて、言い方微妙だけどソーシャルゲームハッカーとか言ってたほうが差別化できるんじゃないの。そこを差別化できない方向であわせる必要ないと思うんですけども。

 

 

それなりに読まれる記事は配信される記事全体の3%程度。

 

これは私のブログに限らず、はてなやアメーバなど各種のブログ、各人の立ち上げるネットメディア全体で、です。paper.liやgunosyなどの業者の傾向を見てもそうであるように、その日に世に出たコンテンツ蒐集には限界があります。彼らはブックマークや、ツイート、いいね、特定のコンテンツ、などから辿っているだけであり、まったく網羅できていません。その結果、バズるかバズらないかの二極化が発生します。なので、かなり運の要素も強いです。運の要素を排除するにはやはり人的ネットワークなんですけど、一般人にはなかなか使えないワザでもあり。

 

で、今回の統計的には、読まれる記事は3%くらいです。なんとも悲しいですね。自分のことはさておいて、良質かどうよりも、タイミングやタイトルというだけでバズるかどうか決まるなんて実社会と同じですね。これはソーシャルから辿れる1000メディア強(含個人ブログ)、万単位記事を適当に巡回してだいたいわかったことです。1年かけてぼんやりやったので迷惑かけてなさそうということでお許しください。コンテンツの97%は何の話題にもならずに死蔵されるコンテンツです。0ツイート0いいね0ブクマがほとんどです。

 

 

各ソーシャルメディアの指標はもはやデフレに突入している

 

1ブックマーク、1いいね、1ツイート、いずれの価値も下落しています。調査の仕方は簡単です。ある程度のボリュームで年代別記事で総合計とって比較すれば良いだけです。なんのことはなくて、2011年度より2012年度が、2012年度より2013年度が、1ブックマーク、1いいね、1ツイート、を獲得しづらくなっているということです。相対的に価値が下落していると言ってよいでしょう。例えば、はてブでは、かつては1000overがザラでしたが、今ではあまり出現しません。ユーザーの減少と固定化が大きいと思います。このへんはもっと丁寧に言いたいテーマですが、私は提言までにしておきますのでどなたかぜひ。

 

 

検索エンジンに期待してはいけない けれどネガティブワードは長期的な効果あり

 

あいかわらず不平等すぎまして、キーワードによる補正ロジックが入っているようです。私のようにネガティブなんて言葉をタイトルに冠しているとペナルティで下がりまくります。SEO的に見ると「データサイエンティスト」では圏外ですが、「データサイエンティスト 消える」「データサイエンティスト 年収」なんかでは高いです。ようするに、これでどういう方にリーチできそうかだいたい予想できますね。統計的有意レベルで観測できていますが、このへんは別の成果物なので割愛します。ようするにポジティブワードだともはや検索順位が上がりづらいやりつくされた感ある世界ですが、ネガティブワードだと比較的簡単に上がるので長期的なアクセスが見込めます。ただし、ネガティブワードの持つラベリングに、当然ながらサイトの訪問者も引きづられているという制約があります。ニッチ戦略は王道ではありません。ネガティブだと陽のあたる道には出にくいです。

 

 

記事のアクセス増要因は、特定の誰が反応してくれるかが、ほぼすべて

 

私は制作ではないのでコンテンツ論しませんが、質や量や独自性やメッセージ性といったコンテンツの中身を語る以前に、ヒットするかどうかでもっと重要なことがあります。それが「誰に届くかどうかが圧倒的に重要」だということです。すでによくある結論かもしれません。そして今や、これがほぼすべてであり、アクセス数の増減に対する最大の寄与率を誇っています。例えばマスメディアの間違いにイチャモンをつけると、彼らは大変敏感なので動いてくれやすいとか、Twitterならばインフルエンサーとしてある人がリツイートすると確変してアクセス数が増えるとかです。あるいは界隈の有識者、例えば、このブログにとってならid:tjoさん(銀座で働くデータサイエンティストのブログ)です。同じような世界を見ていないと同じような問題意識にはなりません。そうではない多くのマジョリティと感覚がズレていたとしても、そういうことはあまり重要にならないです。そうしたマイノリティがどう思ってくれるかどうかが重要というのが、やはりマスメディアとネットメディアの全然違うところですね。

 

 

(一般的に)社会的立場の高めな人は情報共有しにくい

 

またソーシャル的には、社会的立場が高い人(必然的にマイノリティ)に向けて記事を書いても、それはまったくヒットしません。もちろん「おまえはどこの馬の骨だ」補正もありますけども。なぜかといえば、立場表明したくないからです。社会的立場の高い人は前向きな発言しかできないバイアスがあります。経営者が「ブラック企業はけしからん」というテーマの記事に「いいね」できるわけがありません。ブラック企業の経営者ではなくても明日は我が身的がありえるので、心理的にできません。これが実名の特徴です。このように「言いたいけれど言えない世界」というのは需要が見込めるので新しいフロンティアでしょうね。事実、私のように分析に対して皮肉の多い立場は、前向きに業界をアジテートしたい方々からは賛同されるわけがありません。しかし、それなりに需要はあるようです。役職がらみの誰得みたいな話や、データサイエンティスト名乗りたくない系の話は根強くアクセスがありますが、あまりソーシャルではバズりません。この発見は私にとっては一番の収穫でした。

 

 

 

以上、簡単に抽出したものを語りまして、世知辛さが伝わったかと思います。私がここで言いたいのは

 

分析屋なら、ブログを分析に使わないなんて、もったいなさすぎじゃないの

 

ということです。自分のだけじゃなくて他人のでもいいくらいで。データなんてものは、もちろん完全ではないですけど、ビジネスやってる分析屋ならば、マーケッターが主観で語るところを、少しは客観的に言うためのデータは採っておこうよということです。HDD1つに収まる程度のデータ量でした。

 

近年は、いつも手に入らないデータを、指くわえて見ている分析者を多くみかけます。スキルあるのにもったいないことです。そんなこと言ってないで、だったら自分でデータ蒐集しようぜ的な意思を持ったほうが良いです。ビジネスに限るならば、与えてくれるまで待っているスタンスには良いことありません。だから分析の参考書なんて読むくらいなら、まずは実戦してみようよ、と。

 

いいじゃないか、三流で・・・・速い三流なら上等よ!(参考 アカギ

 

という暴論を吐いて勝手にハードル上げて、私も自滅しつつありますけども、それもいいでしょう。自滅します。ほんと蒐集1年は短いようで長かったです。

 

いつも文句ばっかりいってきてごめんなさいね。

 

 

続きもどうぞ

 

 (実務者向け)日本の、データ基盤系エンジニア人数と年収の推定してみた 2014予想

http://negative.hateblo.jp/entry/2013/12/18/180537

データ編です。年末進行その2。それなりに手間かけてます。