色々と纏めさせたり、コード書くのを手伝ったもらったりと、大変便利なOpenAIのGPT。気軽なお遊びはやっぱり、音声でのキャラクター会話だろうとおもって試してみた。
こちらでいい記事を発見!
こちらのコードを元(fork)して手を加えてみた。
・プロンプトを環境変数で指定できるようにした。
・簡単に文章を分割してVIOCE BOXで音声合成することで、発声までの時間を短縮。
・会話の保存数を設定。
・聞き取った言葉が少ない時は非応答。
音声合成部分は、同時処理をどうコーディングすればいいのか、分からないので試行錯誤で実装。これが正しいのかまったく理解できないけれども。動いているからこれくらいで・・・。
最後のセンテンスを発声しながら、マイク入力を受け付けるといいタイミングで録音ができそう。会話で終了させることが、なかなかできない。ここらはプロンプトを上手に使わないといけないだろうか。勉強が追いつかない。
ChatGPTのAPI応答速度があがるとさらに面白くなりそう。API応答待ち時間に適当に相槌の音声を流すだけでも、会話が改善する予感。