STEP 06STT
×
TTS
ALC 一期  /  ELEVENLABS

音 声 11labs

ElevenLabs の Scribe は 日本語文字起こしの精度がトップクラス。 話者分離 (誰が何を言ったか) もできるので、セミナー / MTG / ポッドキャストの議事録化に最適です。 読み上げ (TTS) も使えるので、台本→音声の流れも 1 本のプロンプトで回せます。

前提: API キー入門 を読んで .env.local の概念を理解しておくと早いです。

何ができる

ALC で一番効くのは Scribe での文字起こし。セミナー録画やお客さんとの 1:1 を全部テキスト化して、CC に投げると本人ですら気付かなかった購買心理や反論パターンが浮き上がります。

API キーを取る (3 分)

  1. elevenlabs.io を開いて、右上 Sign up。Google ログインが最速。
  2. ログイン後、右上の自分のアイコン → API Keys
  3. Create API Key を押して、名前を「ALC」とか付ける。
  4. 表示された sk_xxxxxxxxすぐコピー

注意: 一度しか表示されません。閉じる前にコピー必須。

CC にキーを渡す

ElevenLabs の API キーを .env.local に保存してください。
- ファイル: .env.local
- キー名: ELEVENLABS_API_KEY
- 値: [ここに sk_xxxxxxxx を貼る]
- .gitignore に .env.local が入っていることも確認してください。

使ってみる — 音声文字起こし

音声ファイル 1 個から始めましょう。Claude Code にコピペ:

ElevenLabs Scribe で音声ファイルを文字起こししてください。
- 入力ファイル: [ここにファイルパス or URL]
- 言語: ja (日本語)
- 話者分離: ON (誰が何を言ったか分けてください)
- 結果を Markdown 形式で「話者A: ...」「話者B: ...」と整形して .md ファイルに保存してください。

所要時間: 5 分音声 → 30 秒くらいでテキスト化。日本語の認識精度はかなり高いです (固有名詞だけは要確認)。

セミナー録画 → 議事録の決め技

これが効きます。録画ファイルを Downloads に置いて、Claude Code にコピペ:

~/Downloads にある今週のセミナー録画 (mp4) を ElevenLabs Scribe で文字起こしして、議事録にしてください。
- 話者分離 ON
- 文字起こし → 5 行サマリー → トピック別の見出し付き本文 → 質疑応答セクション の構造で Markdown に整形
- 保存先: docs/seminar-YYYY-MM-DD.md

これで 60 分のセミナーが 5 分で完璧な議事録になります。お客さんへの送付・YouTube 字幕化・ブログ記事化に流用可能。

使ってみる — 読み上げ (TTS)

ElevenLabs の TTS (Text-to-Speech) で、以下のテキストを日本語の女性の声で読み上げて mp3 として保存してください。
- テキスト: [ここに読ませたい文章]
- 声: 日本語対応の Voice (Aria や Rachel の日本語版があればそれ、なければ multilingual モデルで)
- 出力ファイル: ~/Downloads/tts-output.mp3
- できたら自動で開いてください。

台本を書いたらそのまま音声化。ショート動画用のナレーション・LINE 配信用の音声メッセージ・教材音声などに使えます。

料金

野田の使い方: 毎週のセミナー (60 分) を Scribe で文字起こし → 文字起こし結果を CC に投げて 5 種類のコンテンツ (ブログ記事 / Threads 5 本 / X 10 本 / IG リール台本 3 本 / LINE 配信 1 本) に同時展開。1 セミナーから 1 週間分の発信ネタが生まれます。

ElevenLabs セットアップ チェックリスト

  • elevenlabs.io でアカウント作成済み
  • API キーを取得して .env.local に ELEVENLABS_API_KEY として保存
  • 音声ファイル 1 個を Scribe で文字起こしして話者分離結果を確認
  • TTS でテキストを日本語音声に変換して mp3 を再生