AIスタックチャン2の基本機能をAtomEchoに移植しました。
特徴
- ATOM Echo単体で動作します。
- 音声合成にWeb版 VOICEVOXを使います。
- 音声認識に"Google Cloud STT"か"OpenAI Whisper"のどちらかを選択できます。
Google Cloud STTは、”MhageGH”さんの esp32_CloudSpeech を参考にさせて頂きました。ありがとうございました。
"OpenAI Whisper"が使えるようにするにあたって、多大なご助言を頂いた”イナバ”さん、”kobatan”さんに感謝致します。
- ATOM Echo
- VSCode
- PlatformIO
使用しているライブラリ等は"platformio.ini"を参照してください。
ChatGPTのAPIキー取得方法は以下の通りです。(詳細はこのページ一番下のリンクを参照してください。)
- OpenAIのウェブサイトにアクセスして、アカウントを作成します。メールアドレスと携帯電話番号が必要です。
- アカウント作成後、APIキーを発行します。APIキーは有料ですが、無料期間やクレジットがあります。
- Web版 VOICEVOX のAPIキーの取得方法は、このページ(ttsQuestV3Voicevox)の一番下の方を参照してください。)
VOICEVOXのAPIキー取得後忘れずに“VOICEVOX用API利用登録”をしてください。そうしないと音声合成が高速にならないので音声が途切れ途切れになります。
Google Cloud Speech to TextのAPIキー取得方法は以下の通りです。(詳細はこのページ一番下のリンクを参照してください。)
- Google Cloud Platformのウェブサイトにアクセスして、アカウントを作成します。メールアドレスと携帯電話番号が必要です。カードの登録が必須ですが、無料トライアルや無料枠があります。
- アカウント作成後、APIキーを取得します。
APIキーでSpeech to Textを有効にするのを忘れないで下さい。
- main.cppの23行目付近、SSIDとPASSWORDを設定してください。
-
main.cppの43行目付近、以下を設定します。
OPENAI_APIKEY
VOICEVOX_APIKEY
STT_APIKEY -
【注意】
STT_APIKEYには"Google Cloud STTのAPIキー" または、OPENAI_APIKEYと同じものを設定します。
STT_APIKEYにOPENAI_APIKEYと同じものを設定した場合は音声認識にOpenAI Whisperが使われます。
- ATOM Echoの電源を入れるとLEDが緑色に点灯してWi-Fiの接続を開始し、接続が完了すると消灯します。
- ボタンAを押すと、マイクからの録音が始まり音声認識で会話できるようになります。
録音時間は2秒程度です。
- Web版 VOICEVOX のAPIキーの取得方法は、このページ(ttsQuestV3Voicevox)の一番下の方を参照してください。)
VOICEVOXのAPIキー取得後忘れずに“VOICEVOX用API利用登録”をしてください。そうしないと音声合成が高速にならないので音声が途切れ途切れになります。