PR NEWSWIRE ASIA によると、中国のSogou Inc.(NYSE:SOGO)が同社のAIを活用した同時通訳ソリューションの次世代版、同時通訳3.0(Sogou Simultaneous Interpretation 3.0 )を発表。
今回のアップグレードではコンピュータービジョン能力と、スピーカーが提示する情報を即座にとらえて理解するAI自己学習能力を統合し、機械翻訳の効率と精度が大幅に向上している。
また、この種のサービスでは初となる、通訳中にリアルタイムで「見る」および「考える」ことができるようになっているのが特徴。
Sogou は光学式文字認識(OCR)および自然言語処理(NLP)テクノロジーを適用しており、プレゼンテーションスライド上の画像を見て処理し、基となっている情報をさらに解釈。さらに独自の「Context Engine」、Knowledge Graphテクノロジー、およびオンライン百科事典Sogou Baikeを活用し、解釈中に「考える」こともできる。
これらの機能により文脈、背景知識を生成し、リアルタイムで正確にスピーカーのメッセージを理解する広範な背景情報を収集するのだ。
このように視覚、音声、テキストなどの異なる様式からの感覚的な入力を分析し、スライド内容の認識精度を21.7%、翻訳精度を40.3%向上させる。この様々な様式からの入力を認識するSogouのソリューションはAI同時通訳の分野をさらに進める大きな一歩となるだろう。
また、各プレゼンテーションを活用して包括的な知識データベースを構築することで、様々な専門知識を持つスピーカーが専門的な情報を正確に説明できるよう対応する。
昨年12月に北京で開催されたGeekPark IF X カンファレンスでデビューを果たしたSogou Simultaneous Interpretation 3.0。
会議、ビデオ翻訳、ライブブロードキャストなど、より多くの場面で正確かつスムーズな通訳サービスを提供することを目指しているとし、これからのAI同時通訳の分野を進化させる起爆剤になりそうだ。
0コメント