この記事で解決すること

「音声をテキストにしたい」「テキストを読み上げてほしい」「自分の声を変えたい」

音声に関するAIツールが増えていますが、どれを使えばいいか分からない。この記事では、無料で使える音声AIを用途別に5つ紹介します。

1. Whisper(文字起こし)

OpenAIが開発した音声認識AI。音声ファイルをテキストに変換します。

  • 日本語対応:◎
  • 精度:非常に高い
  • 使い方:ChatGPTに音声ファイルをアップロードするだけ

会議の録音、インタビュー、講義の文字起こしに最適です。

使い方

  1. ChatGPTを開く
  2. 音声ファイル(mp3、wav等)をアップロード
  3. 「この音声を文字起こしして」と指示

数分で全文がテキストになります。

2. CLOVA Note(文字起こし)

LINEが開発した文字起こしアプリ。スマホで録音しながらリアルタイムで文字起こしできます。

  • 日本語対応:◎(日本語に特化)
  • 精度:高い
  • 使い方:アプリをインストールして録音ボタンを押すだけ

話者の識別もできるので、会議で「誰が何を言ったか」が分かります。

3. ElevenLabs(テキスト読み上げ)

テキストを入力すると、人間のような自然な声で読み上げてくれるAI。

  • 日本語対応:○
  • 無料枠:月10,000文字まで
  • 使い方:https://elevenlabs.io でテキストを入力

ブログ記事の音声版を作ったり、動画のナレーションに使えます。

4. VOICEVOX(テキスト読み上げ)

日本発の無料テキスト読み上げソフト。キャラクターの声で読み上げてくれます。

  • 日本語対応:◎(日本語専用)
  • 完全無料(商用利用もOK)
  • 使い方:ソフトをダウンロードしてテキストを入力

YouTube動画のナレーションによく使われています。

5. RVC(声の変換)

自分の声を別の声に変換するAI。リアルタイムでの変換も可能です。

  • 日本語対応:◎
  • 完全無料(オープンソース)
  • 使い方:やや技術的な知識が必要

配信者やVTuberに人気のツールです。初心者にはハードルが高いですが、興味がある方は「RVC 使い方」で検索してみてください。

比較表

ツール用途日本語無料枠難易度
Whisper文字起こしChatGPT経由簡単
CLOVA Note文字起こし無料簡単
ElevenLabs読み上げ月10,000文字簡単
VOICEVOX読み上げ完全無料簡単
RVC声の変換完全無料やや難

まとめ

  • 文字起こし → Whisper(ChatGPT経由)かCLOVA Note
  • テキスト読み上げ → ElevenLabsかVOICEVOX
  • 声の変換 → RVC

まずはChatGPTに音声ファイルをアップロードして文字起こしを試してみるのが、一番手軽な始め方です。

関連リソース

AIをもっと活用したい方へ: