Iphone

ウェブブラウザで広東語を入力する方法:シアトルのGoogle社員が実現

ウェブブラウザで広東語を入力する方法:シアトルのGoogle社員が実現

テイラー・ソパー

`

アルバート・ウォン。
アルバート・ウォン。

アルバート・ウォンは、生涯を通じてコン​​ピューターで広東語の文字を入力しようと試み、失敗し続けてきた。

しかし今、Google の 20 パーセント プロジェクトによって与えられた時間、素晴らしいチームワーク、そして多大な努力のおかげで、彼は答えを導き出すのに貢献しました。

1年間の努力がついに実を結び、Googleは英語の音声入力機能を使ってウェブブラウザで広東語を簡単に入力できる初のツールをリリースしました。これにより、数十年にわたる問題が解決されました。中国の国語である北京語(マンダリン)には同様のツールが存在しますが、広東語用のツールはこれまでありませんでした。

シアトル出身で、ここエメラルドシティにあるGoogleオフィスでソフトウェアエンジニアとして働くウォン氏は、昨年、Googleのソフトウェアエンジニアであるハンナ・タン氏と共に、広東語が広く話されている香港を訪れた。二人はYelpのようなアプリを使うのに苦労した。広東語の特定の文字の入力方法が分からなかったのだ。

「私たちはそこに座って、これがどれほど厄介な問題なのか考えていました」とウォン氏は振り返る。「何年も前に解決されるべきだったのです。」

広東語のスクリーンショットそこでウォンとタンは、その後12ヶ月間、北京、シンガポール、マウンテンビュー、ニューヨーク市からGoogle社員を集め、この困難で複雑な問題を解決する方法の開発に取り組みました。入力の問題を解析するための言語学のバックグラウンド、言語分析AIの専門知識、あるいは単に広東語の方言に精通した人材など、開発プロセスに不可欠な様々なスキルをそれぞれが持っていました。そしてもちろん、Googleの膨大なデータセットなしには実現できなかったでしょう。

チームにとって大きな問題となったのは、北京語の学習方法とは異なり、広東語は英語の正式なローマ字表記を採用していないことです。さらに、マレーシアからケベックまで、世界中の人々は広東語の綴りや発音に関してそれぞれ異なる基準を持っています。

Google 社員は、あらゆる種類の人々の言語的背景を分析し、英語のテキストを分割して、それを広東語の文字セットにマッピングする方法を理解するモデルを考案する必要がありました。

「基本的に、英語で書かれたランダムな文章を広東語に変換する必要がありました」と、ワシントン大学卒業生でグーグルで7年間勤務したウォン氏は語る。

広東語グーグル

彼ら全員が協力して作り上げたこのアプリは、いわば強化版のスペルチェックのようなもので、広東語のフレーズを、できるだけ英語に近い発音で入力できるようになっています。このプラットフォームに組み込まれた技術は、Google検索のように、ユーザーが入力しようとしている内容を非常に正確に予測します。上のデモ動画では、この点がより明確に示されています。 

ウォン氏は、世界中の5900万人の広東語話者、特に香港の人々にこのツールが役立つことを期待していると述べています。また、広東語を話すにはある程度の英語力はあっても、書き言葉の知識がない人々にも役立つことを期待しています。さらに、音声を推測できる程度の英語力があり、コンピューターを使ってこれまで不可能だったことができるようになった高齢の中国人コミュニティにもこのツールを提供できることを大変嬉しく思っています。

これを「これまでのキャリアで最も誇らしいリリースの一つ」と呼ぶウォン氏は、今後6ヶ月間、寄せられるフィードバックに応じてこの技術を改良していく予定だ。現在、この翻訳ツールはChrome拡張機能として提供されており、まもなくGoogleドキュメントとGmailにも統合される予定だ。