プライベートAIの仕組み
あなたのビジネスドキュメントは、誰かのAIをトレーニングしていない。
その懸念は現実のものです——しかしそれは別のプロダクトの話です。このページでは、プライベートRAGの正確な仕組み、AIプロバイダーに実際に送られるもの、そしてAPIデータポリシーが何を意味するかを説明します。
解説を読む ↓この懸念は正当な理由から来ている
軽く流すのではなく、真剣に受け止める価値があります。
ChatGPT、Gemini、Claude.ai——人々が懸念していること
これらはコンシューマー向けのWebプロダクトです。長い間、これらのプラットフォームでの会話がAIモデルの改善に使われてきました。現在でも、オプトアウトしない限りデフォルトでデータが収集される場合があります。
チームが無料のAI Webアプリにクライアント名・社内価格・法的な質問を入力していたとすれば、その懸念は正当です。これらのプラットフォームはビジネスAPIツールとは異なる利用規約を持っています。
別のアーキテクチャ、別のデータの話
SpiceWorxはコンシューマーAI Webアプリを使いません。私たちがデプロイするシステムは、ドキュメントインデックスをお客様自身のサーバー上で動かします。AIモデルが受け取るのは、特定の質問に答えるときのドキュメントの短い抜粋だけです。
ドキュメントライブラリ全体も、ビジネスのナレッジベースも、AIプロバイダーに送られることはありません。アーキテクチャがそれを構造的に不可能にしており、ポリシーだけで保証しているわけではありません。
RAGとは実際のところ何か
名前は難しく聞こえます。考え方はシンプルです。
RAGはRetrieval-Augmented Generation(検索拡張生成)の略です。AIに質問したとき、システムはトレーニング中にビジネス情報を記憶したモデルを参照するのではありません。リアルタイムでドキュメントライブラリを検索し、最も関連性の高い段落を取得して、その段落をもとにAIが回答を書きます。
ライブラリからドキュメントを削除すると、AIはそれに関する質問に即座に答えられなくなります——再トレーニングなしで。もし情報をモデルが永続的に学習していたなら、それは不可能なはずです。
モデルをデータでトレーニングするということは、あなたの情報がそのモデルの将来の挙動に影響を与えることを意味します——潜在的に何年も。RAGはそのステップを完全に省略します。各クエリは特定のテキストを取得し、一度使い、そこで終わります。
何がどこで動くか
3つのコンポーネント。2つはあなたのサーバー上。外部API呼び出しは1回。
OpenAIに実際に送られるもの
短いリストです。こちらがその内容です。
- ドキュメントライブラリ全体
- Qdrantベクターインデックス
- ドキュメントのファイル名とメタデータ
- 会話履歴とログ
- ナレッジベースに明示的に含めていないドキュメント
- ユーザーの質問(1クエリずつ)
- ドキュメントから最も関連性の高い箇所——約1,200文字
- 提供されたテキストからのみ回答するよう指示するシステム命令
APIデータポリシー——3大プロバイダー横断比較
SpiceWorxは現在OpenAIを使用しています。AnthropicやGoogle Gemini APIに切り替えた場合も同じ原則が適用されます。
| プロバイダー | プロダクト | AIトレーニングに使用? | ポリシー参照 |
|---|---|---|---|
| OpenAI | ChatGPT Webアプリ(無料/Plus) | デフォルトで使用 | openai.com/policies |
| OpenAI | API(GPT-4o) | 不使用——ポリシーに明記 | openai.com/enterprise-privacy |
| Anthropic | Claude.ai Webアプリ(無料/Pro) | デフォルトで使用される場合あり | anthropic.com/privacy |
| Anthropic | Claude API | 不使用——ポリシーに明記 | anthropic.com/privacy |
| Gemini Webアプリ(無料) | デフォルトで使用 | Google Gemini FAQ | |
| Vertex AI経由のGemini API | 不使用——ポリシーに明記 | cloud.google.com/terms |
コンシューマーWebアプリ vs ビジネスAPI
同じ会社の、異なるプロダクト。異なるルール。
- 個人ユーザー向けの無料または定額プロダクト
- デフォルトでモデル改善にデータが使用される場合あり
- データ処理契約なし
- ビジネスの機密コンテンツ向けに設計されていない
- あなたの会社固有のビジネスやドキュメントを知らない
- 開発者・企業向けの有料ビジネスプロダクト
- APIデータはモデルトレーニングに使用されない——明示的なポリシー
- データ処理条件あり
- 本番ビジネスアプリケーション向けに設計
- RAGシステムが送るものだけを受け取る——1クエリ、1抜粋
よくある質問
実際のドキュメントで動くRAGシステムを見てみませんか?
コミットメントなしに、実際のコンテンツで動くデプロイメントをご覧いただけます。
相談を始めるサービス全体はこちら: AIナレッジシステム →