STEP 08D1
×
QA
ALC 一期  /  DATA STORAGE

溜 め 方 の 蔵

せっかく文字起こし・スクレイピング・お客さんとの 1:1 で 大量のデータが手元に集まっても、溜める場所と型が決まってないと、二度と再利用できないただのゴミ山になります。 答えはシンプル: Cloudflare D11 行 = 1 つの Q&Aでカテゴリラベル付きで突っ込む。 これが何にでも転用できる最強の形です。

前提: 必須ツール (wrangler) のセットアップが済んでいること。D1 は wrangler で作って操作します。

なぜスプシじゃなくて D1?

最強の型 — 1 行 = 1 Q&A + カテゴリ

溜め方の 正解は 1 つ: どんな情報源 (セミナー文字起こし / SNS / 1:1 / メモ) も 「想定される質問 + その答え」の 1 ペアに分解して 1 行で保存する。

これに カテゴリ + サブカテゴリ + タグのラベルを付けておけば:

同じデータが、形を変えて何回でも使えます。これが「溜め方が正しい」の意味。

逆に NG なパターン: 文字起こし結果をそのまま 1 ファイル = 1 行で溜める。検索しても全文ヒットで使い物にならない。必ず「質問 + 答え」の 原子単位に分解しておくこと。

D1 を作る (5 分)

Claude Code に以下をコピペ。スキーマも一緒に切ってくれます:

Cloudflare D1 で新しいデータベースを作って、Q&A 形式のテーブルを用意してください。
- DB 名: my-knowledge
- テーブル: qa_pairs
- カラム:
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    category TEXT NOT NULL,
    subcategory TEXT,
    question TEXT NOT NULL,
    answer TEXT NOT NULL,
    source TEXT,
    tags TEXT,
    created_at TEXT DEFAULT (datetime('now'))
- wrangler.toml に binding を追加 (binding 名: DB)
- スキーマ migration ファイルを migrations/0001_init.sql に保存
- wrangler d1 migrations apply で本番に適用してください。

テーブル設計のポイント:

データを流し込む — 文字起こし → QA 分解

セミナー録画を ElevenLabs で文字起こしして docs/ に置いたら、CC に分解させて D1 に流し込みます:

今フォルダにある以下のソースを Q&A 形式に分解して、my-knowledge の qa_pairs テーブルに溜めてください。
- ソース: docs/ 配下の Markdown ファイル全て
- 1 ファイル = 複数 QA に分解 (1 質問につき 1 行)
- category: ファイルが入っているサブディレクトリ名
- subcategory: ファイル内の H2 見出し
- question: 「読者が聞きそうな問い」を 1 文で
- answer: 該当箇所の本文を整理 (200-400 字)
- source: 元ファイルの相対パス
- tags: 関連キーワードをカンマ区切りで 3-5 個

INSERT 文を生成 → wrangler d1 execute で投入してください。

CC は文字起こしを読みながら「ここはこういう質問への答えだな」と判断してペア化してくれます。1 本 60 分のセミナーから 30-80 件の QAが抽出できます。

使う — お客さん対応への自動回答

溜まった QA を使ってお客さんに返事する流れ:

my-knowledge の qa_pairs から、お客さんからの質問「[ここに質問を貼る]」に近い QA を 5 件引いてきて、それを参考に最適な答えを CC として生成してください。
- まず category と質問キーワードで LIKE 検索して候補を 5 件取得
- 取れた answer を要約 → 元の質問への回答を 300 字で生成
- 使った QA の id と source も出典として末尾に明記してください。

これで 「自分の過去発言を全部学習した自分専用 AI」ができあがります。LINE / Slack / メール 全部に応用可能。

カテゴリを育てる

最初は雑にカテゴリ付けて OK。100 件、500 件と溜まってきたら定期的にカテゴリを見直して整理します:

溜まった qa_pairs を眺めて、カテゴリ体系を見直したいです。
- 現在 category にどんな値が入っているか SELECT DISTINCT で一覧表示
- カテゴリ数 / 各カテゴリの件数も集計
- 過剰に細分化されてるカテゴリ / 1 件しかない迷子カテゴリを指摘
- 統廃合の提案を出してください (例: 「A と B は実質同じだから C にまとめる」)。
- 僕が OK したら UPDATE 文を流して再ラベリングしてください。

CC が現状の偏り (細分化しすぎ / 統合候補) を指摘してくれるので、それを見ながら統廃合。これを月 1 でやると、知識ベースが綺麗に育ちます。

設計の流儀

野田の使い方: 毎週のセミナー / 個別 1:1 / Slack のお客さん DM を全部 D1 に溜めて 2,000 件超え。LINE Bot からも検索できるようにしてあって、お客さんの質問に 2 秒で過去の自分の答えが引ける状態。これがないと月数百件の問い合わせは捌けません。

データ蔵 セットアップ チェックリスト

  • D1 で my-knowledge DB と qa_pairs テーブルを作成済み
  • 1 ソース (文字起こし / Markdown) を QA 分解して 10 件以上 INSERT 済み
  • カテゴリ別の件数を SELECT で集計できる状態
  • 1 件の質問に対して類似 QA を引いてくる流れができている
  • 月 1 でカテゴリ統廃合する習慣を決めた