読者です 読者をやめる 読者になる 読者になる

エンジニアリングとお金の話

都内で働くエンジニアの日記です。投資と技術の話題がメインです。

【感想】キャプチャー認証の裏側で・・・

感想

 最近英語の勉強を兼ねてTEDを毎日見る様にしている。毎回見るたびに新しい発見や学びがあるのだが、今日見たTEDは今まで見た中で一番衝撃的な内容であった。

今回TEDで語られた内容はwebで良く見かける

f:id:hatakazu93:20120701072608j:plain

についてである。正式にはキャプチャー認証と言うのだが、各種webサービスを利用する際に入力を求められるあれである。webを利用した事がある人であれば、誰もが入力した事があるであろうキャプチャー認証であるが、正直よく読めない文字が表示される事が多く、なんでこんな事をしなければならないのかといつも不満に思っていた。

そのキャプチャー認証についてだが、裏側ではある事が行われていた。その事について説明していく。

まず、キャプチャー認証が一日当たりに使用される回数についてだが、全世界で一日に2億回入力されている。1回あたりの入力が10秒と換算し毎日50万時間も無駄にしている事になる。

その事に気づいた開発者のルイス・フォン・アーンは、何かこの作業を有効に活用出来ないかと考え、本の電子化に活用する事にたどり着く。コンピューターでは読み取れない文字を、キャプチャー認証を活用する事により、人手を用いて解読してもらおうと考えたのである。

適当に表示されていると思っていたキャプチャー認証で表示される文字についてだが、実は本を電子書籍化する仮定でOCRで読み取れなかった物が表示されていたのである。全然意識していなかったのだが、キャプチャー認証を行う過程で電子書籍化のお手伝いを行っていたと言う事である。具体的には、崩れた文字や、黄ばんでしまった紙に書かれOCRでは読めない文字をキャプチャー認証を使用して複数の人に解読してもらい、その結果を踏まえて単語の確定を行っているらしい。どうりで読みづらい文字が表示されるわけだ・・・

考えれば、気づきそうなアイディアだが、そこに気づき、実用化させてしまうところがすごい。通常人手が必要となる作業には対価が伴う物である。しかし、作業を単純化し、それを多くの人数で割り振る事により、労働と感じさせずに人手を活用する事が可能である事を学んだ。まさに、ITが発達した現在だからこそ出来た新しい仕事の仕組みであるといえよう。

TEDには毎回学ぶ事がある。1日1TEDを心掛けて今後も視聴していきたい。

ルイス・フォン・アーン 「ネットを使った大規模共同作業」

広告を非表示にする