人間と会話するロボットの要素技術

コミュニケーションロボットは数あれど,会話ができるものとなるとそれほど多くはない.その理由として,認識機能が十分でないことがあげられる.

会話に必要な機能として,必要最低限には音声認識機能と,音声合成機能がある.
音声合成に関しては,人間と変わらないところまでいっていると思う.ボーカロイドなど.

ただ,音声認識に関しては,まだまだだと言える.Google音声認識の精度が話題になったが,基本的に音声認識は静かな場所で,1人で使うことを前提としているため,人が生活している空間で使うことは難しい.

技術的には,音声をテキストに変換し,自然言語処理により言葉の意味を理解することができるところまではいっている,と思う.

古くは,テキストだけをもとに人間と対話する人工無脳のELIZAが始まりだったが,テキストを音声にするだけでものすごい困難が伴う.

ELIZAが精神科医をもとにしてあるが,ロボットとなにをしたいかというアンケートでもあったように,雑談によって癒されたいという人が多いと思われる.しかし,雑談するためにも,ロボットは時事的な話題を取り入れ,話すこと.人間の状態に合わせて話し方を変えること,などがある.これらを行うためには,webインテリジェンスと,画像処理技術が必要になる.

Webインテリジェンスによって,ネットに存在する様々な知識をロボットが用いること.画像処理によって,人間の個人認証や,表情認識による感情の識別,人間の周りにある物体の認識,などが行える.

ロボットが人間同士のように,自然なコミュニケーションを行うには,関連性理論によれば,双方が同じ認知環境を持ち,背後にある知識までを共有することで言葉の背後にある意味までも理解できる