地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

ChatGPTと音声で会話する。

色々と纏めさせたり、コード書くのを手伝ったもらったりと、大変便利なOpenAIのGPT。気軽なお遊びはやっぱり、音声でのキャラクター会話だろうとおもって試してみた。

 

こちらでいい記事を発見!

zenn.dev

 

こちらのコードを元(fork)して手を加えてみた。

・プロンプトを環境変数で指定できるようにした。

・簡単に文章を分割してVIOCE BOXで音声合成することで、発声までの時間を短縮。

・会話の保存数を設定。

・聞き取った言葉が少ない時は非応答。

 

音声合成部分は、同時処理をどうコーディングすればいいのか、分からないので試行錯誤で実装。これが正しいのかまったく理解できないけれども。動いているからこれくらいで・・・。

 

最後のセンテンスを発声しながら、マイク入力を受け付けるといいタイミングで録音ができそう。会話で終了させることが、なかなかできない。ここらはプロンプトを上手に使わないといけないだろうか。勉強が追いつかない。

 

ChatGPTのAPI応答速度があがるとさらに面白くなりそう。API応答待ち時間に適当に相槌の音声を流すだけでも、会話が改善する予感。

 

github.com