カテゴリ
ブログパーツ
以前の記事
2011年 01月 2010年 12月 2010年 11月 2010年 10月 2010年 09月 2010年 08月 2010年 07月 2010年 06月 2010年 05月 2010年 04月 2010年 03月 2010年 02月 2010年 01月 2009年 12月 2009年 11月 2009年 10月 2009年 09月 2009年 08月 2009年 07月 2009年 06月 2009年 05月 2009年 04月 2009年 03月 2009年 02月 2009年 01月 2008年 12月 2008年 11月 2008年 10月 2008年 09月 2008年 08月 2008年 07月 2008年 06月 2008年 05月 2008年 04月 2008年 03月 2008年 02月 2008年 01月 2007年 12月 2007年 11月 2007年 10月 2007年 09月 2007年 08月 2007年 07月 2007年 06月 2007年 05月 2007年 04月 2007年 03月 2007年 02月 2007年 01月 2006年 12月 2006年 11月 2006年 10月 2006年 09月 2006年 08月 2006年 07月 2006年 06月 2006年 05月 2006年 04月 2006年 03月 2006年 02月 2006年 01月 2005年 12月 2005年 11月 2005年 10月 2005年 09月 最新のトラックバック
what about?
[WEB2.0]
[net community] only personal note anymore? masaqui[at]gmail.com グルメ情報 [チミンモラスイ!] [iddy profile] [about me] store of amazon 100SHIKI PR Board google proxy mobile view lou_trans LINKZ -- MoKuJi タグ
タモリ(211)
SNS(198) Google(81) グルメ(78) Blog(77) イベント(77) 地域情報(25) WEB2.0(24) amazon(16) SBM(15) HT-03A(14) モニター(14) twitter(9) マメログ(8) metaverse(7) 百式ポイント(6) ジオメディア(5) 検索
ライフログ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧
|
11月15日に開催されたエンジニア交流勉強会「gungi」に参加いたしました。「エンジニア交流勉強会「gungi」 - イベント案内 | 2007-11-15 (木): 第6回エンジニア交流勉強会「gungi」開催のお知らせ」 今回の勉強会テーマは「キーワード検索のむこう側」です。 場所は渋谷のマークシティにあるパソナテックです。 ちょうど当日はすぐそばの、セルリアンタワーでは「Web2.0 EXPO」が開催されていて、何人かの知人はそこからのはしごで来ている方もいらしゃって、そちらの話もすこしだけ聞かせていただきました。 -- ゲスト: : 以下簡単なメモをのこしておきます。 冒頭、ゲストのお三方から、各社の取り組みについてのプレゼン。 それぞれのゲストの方のプレゼンについて、僕のなかでのポイントは... ■goo / 検索に足りないのは、即時性、地域性、社会性。 ■SHOOTI / 粗結合なシステムモジュール。OSSてんこ盛り。 ■Greenhorn BLOG / 情報の方からユーザーに歩み寄る。Heuristic Engine。 こんな感じです。 各社プレゼンの後、シリウスラボの関さんを司会に、ゲストの方のパネルディスカッション。1 検索の裏側について 澤)ウェブ検索のDBはgoogle。ブログ検索や画像検索などは、NTT研究所のエンジンをつかっている。 平)Cで全部書いている。形態素解析だけmecab。 Q 苦労したところは? 澤)スパム対策 平)スパム対策はしていない 齋)人によって、必要な情報の解釈がことなる 会場から「ロボットによるコピペで作られたページはどう対処するか?」という質問 齋)気が向いたときに対応 「デスノート」というのを用意して、ブラックリストとしてURLを追加 関)スパムデータの共有は? 澤)Bulkfeedsで以前公開されていた 平)テキストは問題ないけど貼られている画像に問題があるケースは? 澤)画像検索もテキストでフィルタリングしているので、難しい。画像認識で対応することも考えているが、現状はまだクリアできない。 2 検索サービスの今について Q Yahoo!やgoogleについて 澤)基本ツールになっていると思う。一極集中は健康的じゃない。 齋)Googleはやっぱりいいw CaboChaのひともGoogleにいったよね 関)felixの平尾さんに質問...今のサービスを考えたきっかけは 平)キーワードに依存しないで、情報が歩みよってくるというのをイメージ 関)SHOOTIは? 齋)けっこうマイナーなテーマでも、共有したいニーズがあることに気がついた 関)UIが凝ってますよね? 齋)小学校の教室での学級会のようなイメージ 3 検索の課題 齋)辞書。固有名詞や、キーワードでのゆらぎや送り仮名などの吸収。 gooはどうしているんですか? 澤)人手でメンテしている。口語体のとりこみとかたいへん。 関)同じ言葉で、二つの意味があるようなものありますよね。 齋)文脈の中から判断する キーワードの抽出。 関)モバイル検索は? 澤)webと同じしくみ 検索がヒットしないのは、そもそもモバイルのページがまだまだすくないからかもしれないが、根本的な改善を検討している。 齋)文化の違いもあるし、クロールの問題もある。 4 検索のむこう側 齋)これからlifelogのデータなども検索の対象になると思う 平)情報の方からこっちに来てもらうことを目指す。すぐには難しい。画像や動画の検索など。 澤)googleの"I'm Feeling Lucky"のようなのが理想。ユーザが欲しい情報にたどりつくステップが減る。 関)ソーシャル的なアプローチは? 澤)gooでも最近「gooブックマーク」をはじめたばかり。 齋)使うひとのクラスタリングなどありそう。 関)気分によって、読みたいものが違う場合の対処については? 平)検索結果に、カウンターの情報も提供 澤)探索型+発見型 齋)キーワードが思いつかないようなとき、固有名詞を思い出せないときとか 澤)教えてgooのようなQ&Aが有効 Q 各社のサービスの今後の抱負 澤)集合知を利用したようなよりよいサービスを目指したい 平)精度をあげること。他のサービスでエンジンとして採用してもらって、ユーザーを増やしたい。 齋)おもしろいサービスをつくっていきたい。 会場からの質疑の時間もたっぷりとあったので、いろいろな質問がでましたが、ここでは割愛させていただきます。 個人的には、TF/IDF まわりの話や、グラフ解析、ページのスコアリングのあたりのチューニングといったところのつっこんだ話が聞ければと思いましたが、いろいろな話が聞けて満足です。 今回のテーマは、「キーワード検索のむこう側」ということで、各社キーワードによるクエリーに依存しないような取り組みをおこなっています。 前にも書きましたが...現状は、検索という行為がウェブでの情報探索の起点となっているなかで、各社いろいろな角度からのアプローチに注目したいところです。 "search beyond" というのが、次の10年のテーマといえるかもしれません。 激しく体調が悪かったのですが、懇親会にも参加させていただきました。 ちょっとだけ仕事がらみのお話もしたりw
by p-article
| 2007-11-18 14:00
| 検索エンジン
|
ファン申請 |
||