すっかり話題の巨大言語モデル。OpenAIのchatGPTなら個人が使える価格帯だし、ぼちぼち使ってみたい。そこで、colabでトライしてみた。
whipserで音声認識。chatGPTで返答を作成したらVOICEVOXで音声とする。色んな人が同じような手順でやっているので参考にした。先人と便利なソフトウエアを後悔している方々に感謝。ChatGPTでの会話履歴は考慮せず。
実際やってみると、音声認識も音声合成も実用レベル。ここまでくると自然な返答速度が欲しくなってくる。
参考にさせていただいたサイト。コード部分参考にさせていただきました。感謝いたします。