IT世界大手米メタ・プラットフォームズは5月22日、世界の多様な言語を識別できるAIモデルを複数発表した。同社のVRやAR、SNS等のサービス等に展開される。
同社は今回、言語解析AIが普及していく中で、特定の言語にソリューションが集中し、世界の多くの言語が消滅してしまるリスクに着目。数多くの言語に対応できるようにすることで、世界の言語文化の保全に動く。
今回の発表では、同社の大規模多言語音声(MMS)モデルで、音声合成や音声読み上げの技術を従来の約100言語から10倍以上の1,100言語以上に拡張。音声言語識別でも、従来の40倍以上の4,000以上に拡張する。
同モデルの開発では、研究コミュニティ等と協働。何千もの言語の音声データを収集することが課題となったが、聖書のような宗教的なテキストを利用することを着想。宗教テキストの翻訳書には、異なる言語で朗読する音声記録が公開されており、1,100以上の言語による新約聖書の朗読のデータセットを作成。1言語あたり平均32時間のデータを獲得した。
さらに、様々なキリスト教の宗教的な朗読のラベルなし録音を考慮することで、利用可能な言語数を4,000以上にまで増やすことに成功。収集したデータは男性の声が大半だったが、女性の声でも十分に機能したという。宗教的な言語を生成するような過学習が発生していないこともチェックした。
同社は、開発したモデルとコードをオープンソースで提供する。今後も対応言語を増やしていく考え。
【参照ページ】Preserving the World’s Language Diversity Through AI
Sustainable Japanの特長
Sustainable Japanは、サステナビリティ・ESGに関する
様々な情報収集を効率化できる専門メディアです。
- 時価総額上位100社の96%が登録済
- 業界第一人者が編集長
- 7記事/日程度追加、合計11,000以上の記事を読める
- 重要ニュースをウェビナーで分かりやすく解説※1
さらに詳しく ログインする※1:重要ニュース解説ウェビナー「SJダイジェスト」。詳細はこちら