ネット認証で使われるグニャっとした文字と、無料で学べる語学学習サイトには意外な共通点があった。
いやー、ビール飲みながらTED見てたらびっくりするビデオがあった。2011年12月公開…。もう2年以上も前の動画だけど、今さら知ってなるほどなーと感心してしまいました。
Re CAPTURE プロジェクト
ネットでお馴染みのこの画面。
なんだか読みにくい文字を打たされてストレスが溜まった人も多いのでは?しかも結構読みづらくて、何回も失敗してしまう事も…。
もちろん読みづらいのには理由があって、悪い人がコンピューターで自動的に何回も登録したりするのを防ぐ仕組みです。コンピューターはグニャッとなっている文字を理解できませんが、人間の脳は柔軟だからそれを推測できるでしょ、というギャップを利用した技術。CAPTUREと呼ばれます。
実は昔は、入力するテキストが1つだけだったんですが、だいぶ前から2つになっています。2つになったからセキュリティ2倍!というと、そういう話ではなくて、新しいCAPTUREの中の、片方の文字は特別なのです。
グーグルやアマゾンは書籍の電子化を試みていて、電子化するにはコンピューターに本を読ませ、自動的にテキストを抽出させているんですが(OCRと呼ばれる)、昔の本は画像が鮮明でないしどうも認識率が悪い。15年以上前に刷られた本の30%くらいは認識不可とのこと。そこで、それらのコンピューターに認識されない文字を、認証システムとして利用し、何億ものユーザーに答えてもらおうというスケールの大きいアイデア。
つまり、あのグニャっとした文字は、実際に昔の本から切り出された文字で、たくさんの人が同じ画像に対して同じ回答をすれば、晴れてそのテキストが正確に電子化されました!というわけです。先に「片方の文字」と言いましたが、片方は既に解析されている文字、もう片方はまだ未知の文字ということです。
サイトのセキュリティも高まるし、書籍の電子化も促進させるアイデアなんだということを今しりました。すげー。
語学学習と翻訳
以前この記事でDuolingoというサイトを紹介しましたが、実はこのウェブサイトもほぼ同じアイデアから始まっいることを知ってビックリ。
外国語が無料で勉強できて、便利なサイトだなーなんて単純に思ってたんですが、、、その背景にある本来の目的に驚きました。
その目的とは「インターネットの全翻訳」。
インターネットの情報の多くは英語です。英語ができれば多くの情報にアクセスできますが、そうでなければ、その体験は限られる。もしウェブ上の情報を英語以外の主要言語に翻訳できたら…という発想から始まったプロジェクト。
でもどうやって、膨大な量の情報を翻訳するか。
そもそもそんな数の翻訳者がいないだろうというのが問題だし、お金がかかりすぎます。
そこで練りだされたのが、語学学習サイトというアイデアです。
Duolingoをやってみると分かりますが、サイトは問題が出されて、答えて、出されて、答えて、という単純なカタチです。ところが、その問題を解くたびにあなたはインターネットの翻訳に貢献していて、初学者が勉強のためにサイト上で翻訳された文章は、その他のたくさんの回答者の文章と融合され、最終的にはインターネットの翻訳のために使われる、と。
そうすることで、本来お金を払って依頼する翻訳が、「無料で」ものすごく「高速に」進むし、サイトの利用者は「無料で語学学習」できる。実際にはユーザーは時間を投資しているわけですが、その時間は語学を学びたいのであれば、結局は投資していた時間ですから、だれもが得をするシステムで誰もがハッピー。
それだけでなく、一般に語学学習に支払われる費用は、世界中の95%の人が支払えない額なんだということで、無料で提供できるDuolingは誰にでもフェアなんだ、というめちゃくちゃよくできた仕組みなのです。
TED
2年前の動画ですが、おもしろいので是非。
日本語字幕もあります。
Re CAPTUREもDuolingoも、誰もが幸せになれる仕組みを作り出していて、これこそアイデアだなーと思いましたっと。
あ Re CAPTURE にはたまにイライラさせられるけどね…