S M T W T F S
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30
カテゴリ
ブログパーツ
以前の記事
最新のトラックバック
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
what about?
[WEB2.0]
[net community]
only personal note
anymore?


masaqui[at]gmail.com

グルメ情報

[チミンモラスイ!]
[iddy profile]
[about me]
store of amazon
100SHIKI PR Board

Webスカウター情報 [Web Scouter]
スカウター : チミンモラスイ?

ページランク



ASPアクセス解析

google proxy
mobile view

lou_trans


LINKZ
--

あわせて読みたい

MoKuJi
タグ
検索
ライフログ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧

ブロ電™切符

「ブログ通信簿」 by gooラボ
f0002759_2333166.jpggooラボから、ブログの分析をおこなうサービスが提供されております。


あなたの「ブログ通信簿」は? 年齢や影響度など推定 gooラボ」2008.7.23 @ITmedia
ブログ記事をもとにブロガーの年齢や性別、影響度などを推定し、“通信簿”として表示する「ブログ通信簿」が公開された。

→「ブログ通信簿 - goo ラボ
→「「gooラボ」で、ブログ記事からブロガーの年齢や性別、ブログの影響度などを推定する「ブログ通信簿」の実験を開始」@プレスリリース - gooヘルプ
→「「ブログ通信簿」スタート!」2008.7.23 @gooラボ スタッフブログ

【関連記事】
goo、ブログ記事から年齢や影響度を分析する「ブログ通信簿」」2008.7.23 @BB Watch
「ブログ通信簿」で有名人「採点」 おバカ上地は影響力わずか「2」」2008.7.24 @J-CASTニュース
:



プレスリリースによると、日本電信電話株式会社の発表した以下の技術を使っているとのことです。
◆文書属性推定技術
 ブログ記事から「かしら?」などの「女性」らしい表現や「20代」のブログで多い「就職活動」など、性別や年齢層ごとに特徴的な言葉を抽出し、性別や年代を推定する技術

◆評判情報インデクシング技術
 ブログ記事から「楽しい」、「うれしい」などの評判を表す表現を抽出するとともに、それらの表現が肯定的か/否定的かを判別する技術

◆記事タグ推定技術
 ブログ記事に含まれる特徴的な単語の統計量を抽出し、それをもとに任意のテキストに対して高い精度で自動的にタグ(話題を表すキーワード)を付与する技術

◆EigenRumor
 ブログへのリンク数、記事掲載数、注目度の高いブロガーからのリンクの有無からブロガーの持つ影響度を数値化する技術


株式会社ブログウォッチャーでも、同様の技術アプローチからブログのテキストマイニングをおこなっていますね。

→「株式会社ブログウォッチャー: 技術のご紹介

f0002759_23455889.gifブログのURLを入力して[通信簿の作成]を行うと、10秒くらいで通信簿が発行されます。

→「通信簿の見方
ブログ性別とブログ年齢
ブログ性別とブログ年齢は、ブログに書かれた内容や言葉遣いなどから自動的に推定されます。例えば、実際には20代の方でも、40代がよく話題にする内容を書いていると40代と判定されます。また、言葉遣いが女性っぽいと女性となります。実際のブログ作者のプロフィールを示すものではありません。

主張度
主張度は、ブログにどれだけ自分の意見や感情などを書き込んだかによって決まります。「5」が最もこのような傾向が強いことを表します。

気楽度
気楽度は、ブログの中にある、ポジティブな表現とネガティブな表現との比率によって決まります。例えば、「楽しい」などポジティブな内容がたくさん書かれている場合は「5」になります。

マメ度
マメ度は、ブログの更新頻度によって、判定されます。更新頻度が高くなると「5」になります。

影響度
影響度は、あなたのブログがどの程度引用されたかを統計処理して算出されます。最高が「5」です。

通信欄
主張度、気楽度、マメ度、影響度から総合的に判断しています。また、「話題」や「目指すべき職業」も文書の内容から推定しています。


「ブログ通信簿」のページに、[他の友だちの通信簿を見る]というリンクが設けられていますが、gooブログ検索に以下のクエリがリクエストされて検索結果として、「ブログ通信」へのリンクや、該当プレスリリースについてのリンクをおこなっているエントリ等を抽出します。

link:http://blogreport.labs.goo.ne.jp
link:http://blogreport.labs.goo.ne.jp/
link:http://blogreport.labs.goo.ne.jp/tushinbo.rb
link:http://blogreport.labs.goo.ne.jp/desc.rb
link:http://help.goo.ne.jp/info/detail/1181/


この「ブログ通信簿」は、最新記事10件から分析されるそうです。
サーバーの負荷対策ということで1日1回のみの利用に制限されておりますが、当ブログは、だいたい1日1エントリというペースなので、記事によってどのように評価が変わるのかというのを見てみました。

f0002759_00610.jpgf0002759_003599.jpg

f0002759_004826.jpgf0002759_01586.jpg

f0002759_0573758.jpgおっ?ちょっと若返ってるww

基本的に、「放送委員」か「生活委員」(笑)
マメ度というところが、3か5で変化していますが、更新のタイミングで変化しているかなー??

微妙に変化しているのが確認できますが、主張度の成績は「1」のままです。
実際に、このブログでは主張というか主観的なことはほとんど記述していないので、精度の高い評価といえるかもです(笑)

ちなみに、貼り付け用の上記の通信簿の画像は、pngで提供されているのですが、作成中の画像や、解析ができないときの画像は、gifとなっているのが気になりますw
(エキブロではpng画像は投稿できないので、jpgに変換してあります)

f0002759_091512.gifTwitterやTimelogのような、ライフストリーミング的なサービス(マメログ/マイクロメッセージングサービス)は、一部でミニブログというように呼ぶ人がいるようですが、「通信簿」は発行してもらえないようです。

pingが送れないとだめなのかな?


すごく面白いサービスだとおもうのですが、せっかくエントリの内容によって評価が変動するのに、一度やってみてそれっきりになってしまいそうなのがもったいない気がします。
継続的に数値を追いかけられるようなしくみについても期待したいところです。
ブログパーツとかでの対応というのは、更新のたびに全てのブログを解析することになるのでなにげ難しいのかな??どちらにしても、このブログでは、たいていのブログパーツが利用できないのですがww
[PR]

by p-article | 2008-07-28 00:15 | コミュニティ
<< "未来のCyberB... "newsingモバ... >>