S M T W T F S
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30
カテゴリ
ブログパーツ
以前の記事
最新のトラックバック
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
what about?
[WEB2.0]
[net community]
only personal note
anymore?


masaqui[at]gmail.com

グルメ情報

[チミンモラスイ!]
[iddy profile]
[about me]
store of amazon
100SHIKI PR Board

Webスカウター情報 [Web Scouter]
スカウター : チミンモラスイ?

ページランク



ASPアクセス解析

google proxy
mobile view

lou_trans


LINKZ
--

あわせて読みたい

MoKuJi
タグ
検索
ライフログ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧

ブロ電™切符

「Web2.0サロン(web.two.o.salon)」
MYCOM PC WEB で先行告知されていた「Web2.0サロン」がオープン。
来週公開「Blog Keyword Visualizer」--流行ブログワードがぐりぐり動く

Blog のトピックを時系列で表示するサービス、So-net の「Web2.0 サロン」で提供
SCNがWeb2.0サロンを開設。「Blog Keyword Visualizer」ベータ版を提供
So-net、「Web2.0サロン」開設--ブログで話題のキーワードをノードグラフ化

プレスリリース



f0002759_1538350.jpg

サロン
なにかこう、艶めかしい響きを持つ語感だが、一応辞書で調べてみたり。

サロン 1 [(フランス) salon]
(1)客間。応接室。
(2)(フランスで)上流婦人がその邸で催す社交的な集まり。
(3)(ホテル・客船などの)談話室。大広間。サルーン。
(4)酒場。
(5)〔ルーブル宮のサロンでフランス-アカデミーの展覧会が開かれたことから〕現存作家による公式の美術展覧会。

三省堂提供「大辞林 第二版」より


まあ、「ヒトが集まるところ」と捉えればいいのかしら。さんざん使い回された感のある「ラボ」と差別化を図ったのかな?
たしかに、laboというと、理系な感じで、いまや万人が利用するインターネッティングとは乖離したイメージがなくもない…
でも、「Web2.0サロン」なので、WEBなナウい技術が集う場所という感じだろうか?

前置きは、これくらいにして、トップページには以下のようにあります。
So-netでは、これまでもSo-net BlogやMondo(口コミ検索)、So-net Clip!(RSSリーダー)などをはじめとして、 Web2.0の流れに沿ったサービスを展開してきました。そして、今後もさらにWeb2.0の流れを推進して行きます。 その新たな取り組みの第一弾として、「Blog Keyword Visualizer」をご紹介します。


今回のサイトの開設にあたっての目玉は、「Blog Keyword Visualizer」ということのようです。

f0002759_15384964.jpg
f0002759_15385857.jpg
f0002759_153974.jpg
f0002759_15391836.jpg

ちょっとわかりにくいですが、真ん中のサークルからキーワードが"うにうに"と生まれてきて、それらが互いに関連性にしたがって結びついていくというような感じです。
専用のアプリケーションとして提供されているのですが、設定などなにもなく、ただ生まれてくるのみ。「増殖」という表現がしっくりくるかな。

プレスリリースによると
「Blog Keyword Visualizer」は、国内の主要なBlogサイトに投稿された記事を、RSSを用いてSo-netで運用するサーバーで随時収集します。収集されたBlog記事はSo-netで開発した固有表現抽出システムを用いて解析され、各記事の中に含まれる固有表現(*3)を抽出します。各ユーザーのPCで動作するアプリケーションソフトは、この解析済みデータを定期的に取得して画面上に表示しています。このソフトを通してユーザーは、Blog記事で語られている話題の動向をビジュアルに見ることができます。

ポイントとしては、このビジュアル化された情報により
□ブログから抽出されたキーワードを閲覧
□キーワードの関連を認識
□話題の中心となっているキーワードを認知
□話題の盛り上がり具合を把握
といった感じらしいです。

各キーワード群は、
[entertainment][economy][computer][sports][society][life]
にクラスターを形成する。

f0002759_15401078.jpg

キーワードをダブルクリックすると、So-netの検索ページとしてブラウザが立ち上がり検索結果を表示します。
また、キーワードをつないでいるリンクをダブルクリックすることで、そのキーワードを含んだブログにアクセスできる。

技術のポイントのポイントとして
固有表現抽出システム

 固有表現抽出システムは、日本語文章中から、人名や地名、組織名などといった固有名称を固有表現として自動的に抽出することを可能にします。本システムは奈良先端科学技術大学院大学の自然言語処理学講座で開発された技術である茶筌(http://chasen.naist.jp/hiki/ChaSen/)、および Yamcha(http://chasen.org/~taku/software/yamcha/)をベースに開発しています。
 このシステムは教師付き学習アルゴリズム(*4)を応用しており、あらかじめ既存のサンプルデータを使ってシステムを学習させておくことによって、任意の文章から固有表現をキーワードとして抽出することが可能です。今回特にBlog記事をサンプルデータとして学習させたことにより、新聞などとは違ってカジュアルな表現が主体になるBlogの文章でも適切にこれら固有表現を抽出することが可能になりました。

 また、従来のキーワード抽出技術では、たとえば文章中に「世界の中心で愛を叫ぶ」というような一連の単語群から成り立つ表現があった場合に、あらかじめキーワード辞書にその表現を登録しておかないと、それが映画や本のタイトルを表す固有な表現として抽出することは困難でした。
 しかし、この技術ではその文字列が出現する前後の文章構造を解析することにより、自動的にこれら一連の単語群をひとつの固有表現として抽出することが可能です。

 これらの特長により、従来のBlogマイニング技術(*5)に比べて、本システムでは、Blog記事のように日々新たな話題が語られるような場面においても、本やドラマ・映画のタイトルなどの文字列を固有表現としてより精度高く抽出することができます。

だそうである。なにやらスゴイ技術だということだけは理解できた。
多分テキストマイニングにおける、構文解析の延長技術なんだろうくらいに思っているがどうなんだろう?

検索語から、トレンドを類推する「Kizashi.jp」と比較して、どのような違う価値を利用者に対して提供できるかというところに注目したいと思います。


ISP系ポータルとしてブログサービスの参入としては後発組のSo-netですが、PostPetのような新しい価値を生み出すのか?という期待感もあります。

検索を機軸としたサービスでは、利用者が情報をプルする能動的なアクションがもとめられますが、そのための「受動的能動性(?)」を支援するサービスになるのでしょうか。
[PR]

by p-article | 2006-01-24 16:00 | コミュニティ
<< ブログでCM配信 オモテナシノココロ >>