この記事で解決すること
「音声をテキストにしたい」「テキストを読み上げてほしい」「自分の声を変えたい」
音声に関するAIツールが増えていますが、どれを使えばいいか分からない。この記事では、無料で使える音声AIを用途別に5つ紹介します。
1. Whisper(文字起こし)
OpenAIが開発した音声認識AI。音声ファイルをテキストに変換します。
- 日本語対応:◎
- 精度:非常に高い
- 使い方:ChatGPTに音声ファイルをアップロードするだけ
会議の録音、インタビュー、講義の文字起こしに最適です。
使い方
- ChatGPTを開く
- 音声ファイル(mp3、wav等)をアップロード
- 「この音声を文字起こしして」と指示
数分で全文がテキストになります。
2. CLOVA Note(文字起こし)
LINEが開発した文字起こしアプリ。スマホで録音しながらリアルタイムで文字起こしできます。
- 日本語対応:◎(日本語に特化)
- 精度:高い
- 使い方:アプリをインストールして録音ボタンを押すだけ
話者の識別もできるので、会議で「誰が何を言ったか」が分かります。
3. ElevenLabs(テキスト読み上げ)
テキストを入力すると、人間のような自然な声で読み上げてくれるAI。
- 日本語対応:○
- 無料枠:月10,000文字まで
- 使い方:https://elevenlabs.io でテキストを入力
ブログ記事の音声版を作ったり、動画のナレーションに使えます。
4. VOICEVOX(テキスト読み上げ)
日本発の無料テキスト読み上げソフト。キャラクターの声で読み上げてくれます。
- 日本語対応:◎(日本語専用)
- 完全無料(商用利用もOK)
- 使い方:ソフトをダウンロードしてテキストを入力
YouTube動画のナレーションによく使われています。
5. RVC(声の変換)
自分の声を別の声に変換するAI。リアルタイムでの変換も可能です。
- 日本語対応:◎
- 完全無料(オープンソース)
- 使い方:やや技術的な知識が必要
配信者やVTuberに人気のツールです。初心者にはハードルが高いですが、興味がある方は「RVC 使い方」で検索してみてください。
比較表
| ツール | 用途 | 日本語 | 無料枠 | 難易度 |
|---|---|---|---|---|
| Whisper | 文字起こし | ◎ | ChatGPT経由 | 簡単 |
| CLOVA Note | 文字起こし | ◎ | 無料 | 簡単 |
| ElevenLabs | 読み上げ | ○ | 月10,000文字 | 簡単 |
| VOICEVOX | 読み上げ | ◎ | 完全無料 | 簡単 |
| RVC | 声の変換 | ◎ | 完全無料 | やや難 |
まとめ
- 文字起こし → Whisper(ChatGPT経由)かCLOVA Note
- テキスト読み上げ → ElevenLabsかVOICEVOX
- 声の変換 → RVC
まずはChatGPTに音声ファイルをアップロードして文字起こしを試してみるのが、一番手軽な始め方です。
関連リソース
AIをもっと活用したい方へ:
リンク