S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
カテゴリ
ブログパーツ
以前の記事
最新のトラックバック
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
「第12回ジオメディアサ..
from チミンモラスイ!
what about?
[WEB2.0]
[net community]
only personal note
anymore?


masaqui[at]gmail.com

グルメ情報

[チミンモラスイ!]
[iddy profile]
[about me]
store of amazon
100SHIKI PR Board

Webスカウター情報 [Web Scouter]
スカウター : チミンモラスイ?

ページランク



ASPアクセス解析

google proxy
mobile view

lou_trans


LINKZ
--

あわせて読みたい

MoKuJi
タグ
検索
ライフログ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧

ブロ電™切符

第6回エンジニア交流勉強会「gungi」
f0002759_12361671.jpg11月15日に開催されたエンジニア交流勉強会「gungi」に参加いたしました。


エンジニア交流勉強会「gungi」 - イベント案内 | 2007-11-15 (木): 第6回エンジニア交流勉強会「gungi」開催のお知らせ
今回の勉強会テーマは「キーワード検索のむこう側」です。

近年Googleに代表されるキーワード検索は、今やエンジニアにとっても必要不可欠のツールとなりました。しかし、本当に欲しいデータを取得できているかと言えば、まだまだ満足できないという方も多いと思います。
今回はそんなキーワード検索の「むこう側」を模索しながら、思わず検索したくなるようなサービスを開発している現場のエンジニアをお呼びしました!

まずお一人目は、NTTレゾナント株式会社が運営するgooで、「緑のgoo」、「検索UIラボ」の企画開発を担当しておられる澤村氏。

お二人目は株式会社ブログウォッチャーが手がけるブログ・クチコミ検索:SHOOTI(シューティ)のWEBデザイン以外全部を担当されている齊藤氏。

三人目は株式会社フェリックスが手がける「Greenhorn」の開発を担当されている平尾氏です。

このお三方をゲストにお招きして、検索サービス開発の裏側や、キーワード検索のむこう側についてお伺いしていきます。

そして最後に、経済産業省の情報大航海プロジェクトで採択された株式会社ブログウォッチャーの「WEBオカン」のご紹介をしていただきます。

◆今回シゴタノ! for エンジニアはお休みです!


場所は渋谷のマークシティにあるパソナテックです。
ちょうど当日はすぐそばの、セルリアンタワーでは「Web2.0 EXPO」が開催されていて、何人かの知人はそこからのはしごで来ている方もいらしゃって、そちらの話もすこしだけ聞かせていただきました。

--
ゲスト:
・NTTレゾナント株式会社
 澤村 正樹氏
  ポータル事業本部 メディア事業部 検索担当。「緑のgoo」、「検索UIラボ」の企画開発を担当。

・株式会社ブログウォッチャー
 齊藤 光正氏
  チーフアーキテクト。WEBデザイン以外全部担当。

・株式会社フェリックス
 平尾 匡弘氏
  組み込み研究開発及びウェブシステム開発担当。

内容:
○検索対談
○プレゼンテーションタイム
○WEBオカンについて

:



以下簡単なメモをのこしておきます。

冒頭、ゲストのお三方から、各社の取り組みについてのプレゼン。

それぞれのゲストの方のプレゼンについて、僕のなかでのポイントは...

■goo / 検索に足りないのは、即時性、地域性、社会性。

■SHOOTI / 粗結合なシステムモジュール。OSSてんこ盛り。

■Greenhorn BLOG / 情報の方からユーザーに歩み寄る。Heuristic Engine。
こんな感じです。

f0002759_12512076.jpg各社プレゼンの後、シリウスラボの関さんを司会に、ゲストの方のパネルディスカッション。


1 検索の裏側について
澤)ウェブ検索のDBはgoogle。ブログ検索や画像検索などは、NTT研究所のエンジンをつかっている。
平)Cで全部書いている。形態素解析だけmecab。

Q 苦労したところは?
澤)スパム対策
平)スパム対策はしていない
齋)人によって、必要な情報の解釈がことなる

会場から「ロボットによるコピペで作られたページはどう対処するか?」という質問
齋)気が向いたときに対応
 「デスノート」というのを用意して、ブラックリストとしてURLを追加

関)スパムデータの共有は?
澤)Bulkfeedsで以前公開されていた

平)テキストは問題ないけど貼られている画像に問題があるケースは?
澤)画像検索もテキストでフィルタリングしているので、難しい。画像認識で対応することも考えているが、現状はまだクリアできない。


2 検索サービスの今について
Q Yahoo!やgoogleについて
澤)基本ツールになっていると思う。一極集中は健康的じゃない。
齋)Googleはやっぱりいいw CaboChaのひともGoogleにいったよね

関)felixの平尾さんに質問...今のサービスを考えたきっかけは
平)キーワードに依存しないで、情報が歩みよってくるというのをイメージ

関)SHOOTIは?
齋)けっこうマイナーなテーマでも、共有したいニーズがあることに気がついた
関)UIが凝ってますよね?
齋)小学校の教室での学級会のようなイメージ

3 検索の課題
齋)辞書。固有名詞や、キーワードでのゆらぎや送り仮名などの吸収。
 gooはどうしているんですか?
澤)人手でメンテしている。口語体のとりこみとかたいへん。
関)同じ言葉で、二つの意味があるようなものありますよね。
齋)文脈の中から判断する キーワードの抽出。

関)モバイル検索は?
澤)webと同じしくみ 検索がヒットしないのは、そもそもモバイルのページがまだまだすくないからかもしれないが、根本的な改善を検討している。
齋)文化の違いもあるし、クロールの問題もある。

4 検索のむこう側
齋)これからlifelogのデータなども検索の対象になると思う
平)情報の方からこっちに来てもらうことを目指す。すぐには難しい。画像や動画の検索など。
澤)googleの"I'm Feeling Lucky"のようなのが理想。ユーザが欲しい情報にたどりつくステップが減る。

関)ソーシャル的なアプローチは?
澤)gooでも最近「gooブックマーク」をはじめたばかり。
齋)使うひとのクラスタリングなどありそう。

関)気分によって、読みたいものが違う場合の対処については?
平)検索結果に、カウンターの情報も提供
澤)探索型+発見型

齋)キーワードが思いつかないようなとき、固有名詞を思い出せないときとか
澤)教えてgooのようなQ&Aが有効

Q 各社のサービスの今後の抱負
澤)集合知を利用したようなよりよいサービスを目指したい
平)精度をあげること。他のサービスでエンジンとして採用してもらって、ユーザーを増やしたい。
齋)おもしろいサービスをつくっていきたい。

会場からの質疑の時間もたっぷりとあったので、いろいろな質問がでましたが、ここでは割愛させていただきます。

個人的には、TF/IDF まわりの話や、グラフ解析、ページのスコアリングのあたりのチューニングといったところのつっこんだ話が聞ければと思いましたが、いろいろな話が聞けて満足です。

今回のテーマは、「キーワード検索のむこう側」ということで、各社キーワードによるクエリーに依存しないような取り組みをおこなっています。

前にも書きましたが...現状は、検索という行為がウェブでの情報探索の起点となっているなかで、各社いろいろな角度からのアプローチに注目したいところです。

"search beyond" というのが、次の10年のテーマといえるかもしれません。


激しく体調が悪かったのですが、懇親会にも参加させていただきました。
ちょっとだけ仕事がらみのお話もしたりw
[PR]

by p-article | 2007-11-18 14:00 | 検索エンジン
<< Evan Williams ×... [タ]秋刀魚の食べ方 >>