2010年03月13日

人間判断機能が文書スキャナに、迷惑メール判定機能がリコメンド機能に


とあるメルマガで知ったのですが、CAPTCHAという機能が文書のスキャンに役立っているそうです。CAPTCHAというのは、ネットのサービスなどで、ユーザー登録をするときに、スパマーが大量にアカウントを取得しないように歪んだ文字列の画像を入力させる機能です。みなさんも1度は見たことがあると思います。文字列を歪ませれば、それは人間しか読むことができず、正しく入力したときは、それは人間が入力したものであると判断する仕組みです。

そのスパマー退治システム「CAPTCHA」を別の用途に転用した例があります。機械が読めなかった文字列をCAPTCHAで表示し、人間に正しい文字列を入力した結果をフィードバックさせることでスキャンの精度を上げていくのに使われているそうです(関連記事:Anti-spam tool used to translate old books)。実際にGoogleは書籍や雑誌をスキャンするためにCAPTCHAを提供する会社を買収までしています(関連記事:グーグル、認証システムベンダーのreCAPTCHAを買収)。

「機械が読めない文字列の画像」と「正しい文字列」の組で「人間が入力した文字列」を判断するかわりに、「機械が読めない文字列」と「人間が入力した文字列」の組で、「正しい文字列」を得ようとするわけです。

扱う情報を組み合わせることで別の機能を生みだした例だと思います。似たような例として、迷惑メールの判定機能とユーザーへのリコメンド機能があります。

迷惑メールをフィルタリングする機能でベイジアンフィルタというものがあります。詳しい説明は省きますが、学習型の迷惑メール判定機能です。メールを受信したとき、迷惑メールが自分のInboxに入ってしまったとき、ユーザーがこれは迷惑メールだと指定すると、メールの内容などが学習されて、次回から迷惑メールと判断させるものです。ユーザーが適切に迷惑メールを指定すると非常に高い確率で迷惑メールを判別してくれます。

このベイジアンフィルタですが、特定のユーザーにおすすめの記事や商品を提示する機能としても使われているようです。よく考えたら、迷惑なものの反対はお薦めするものになります。つまり、迷惑メールに使うベイジアンフィルタは、ユーザーにとって“不利益な情報”を抽出して、ユーザーに見せなくします。一方、リコメンドで使うベイジアンフィルタは、ユーザーに“有益な情報”を抽出して、ユーザーに見せるわけです。

表から見るとまったく異なるテクノロジーかと思いきや、実は同じ機能だったというわけです。このような例はほかにもありそうです。探してみると面白いかもしれません。そして、いつも触れているものをさまざまな角度から見直すことで、新しい発見ができるかもしれません。

では、今回はここまで。

posted by やすお at 02:17 | Comment(0) | TrackBack(0) | IT業界動向 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのトラックバックURL
http://blog.seesaa.jp/tb/143495048

この記事へのトラックバック



×

この広告は1年以上新しい記事の投稿がないブログに表示されております。