
マイクロソフトがウェブ版Wordに自動文字起こし機能を追加 — その仕組みはこうだ
トッド・ビショップ著

Microsoft は、Web 上の Word に自動文字起こし機能を追加し、Microsoft 365 加入者に対して、プログラムを通じて行われた録音の文字起こしを追加料金なしで無制限に提供し、別途録音してアップロードしたオーディオについては、1 か月あたり最大 5 時間まで無料で文字起こしできるようにします。
今朝発表されたこの新機能は、Otter.ai、Temi、Google Live Transcribe、NuanceのDragonソフトウェアといった無料および有料の自動文字起こしサービスやプログラムと競合することになる。WordなどのOfficeプログラムにアクセスできるMicrosoft 365加入者は数億人おり、Microsoftの今回の動きはより大きな影響を与える可能性がある。
人工知能と音声認識の進歩により、自動文字起こしは、まだ完全な精度ではないものの、多くの場面で人による文字起こしの代替手段として現実的になってきました。また、ビデオ会議サービスに組み込まれた録画機能をユーザーが活用するようになり、バーチャル会議への移行も自動文字起こしの需要を高めています。
もう1つの注目を集めた例として、ZoomとOtter.aiは今年初め、有料サブスクリプションプランの一部として文字起こし機能を導入しました。
Microsoftによると、Web版Wordの機能として、Microsoft Teamsを含むあらゆるコンピューターとあらゆる会議ソフトウェアで利用できるという。自動文字起こし機能は、今年後半にiOSおよびAndroid版Microsoft Wordアプリに追加される予定。将来的にはデスクトップ版Microsoft Wordにも搭載される可能性がある。
Microsoft の文字起こし機能は、本日より Microsoft 365 サブスクリプションをお持ちのお客様に、Web 版 Word の「ディクテーション」アイコンからご利用いただけます。この機能を有効にすると、ブラウザウィンドウの右側のペインに機能が表示され、プログラムから文字起こし用の録音を開始したり、別途作成した録音をアップロードしたりできます。
トランスクリプトは最初に右側のペインに表示され、テキストを編集して、完全なトランスクリプトまたは個々の段落をメインの Word 文書にコピーするオプションがあります。
同社は現時点ではリアルタイムでの文字起こし表示は行わず、録音完了後に文字起こしされたテキストを表示することを決定しました。これはユーザーテストの結果ですが、将来的には文字起こしのリアルタイム表示も検討していくと、マイクロソフトのプリンシパルグループPMマネージャーであるダン・パリッシュ氏は今週の記者会見で述べました。
「実際にインタビューをしていると、リアルタイムでテキストが表示されると気が散ってしまうという人がいます。そのため、現在のデザインでは意図的にそれを分かりにくくしています」とパリッシュ氏は述べた。「もしそれが本当に価値があると人々が考えるなら、あるいはそれに関するフィードバックが多数寄せられれば、モデルを変更してリアルタイムで表示することを検討します。」
同社によれば、文字起こしはバックグラウンドで行われるため、会話終了後の処理に必要な時間は数分に短縮されるという。
オーディオが録音されているときは、ブラウザ タブに赤いアイコンが表示され、録音がアクティブであることを示すタイマーが表示されますが、最初の使用で気付いた欠点の 1 つは、録音にオーディオが実際に登録されていることを確認するためのサウンド メーターやその他の手段がないことです。多くのコンピューターのマイクの設定が不安定な性質であることを考えると、これは懸念事項になる可能性があります。
また、現在、月間300分の制限を超えるアップロード時間の追加購入オプションはありませんが、将来的には追加アップロード時間を有料化するオプションを検討しているとのことです。ウェブ上のMicrosoft Wordから直接録音した音声の文字起こしには制限はありません。