AIコンパニオンのコストを静かに殺すのは推論(GPU)ではなく、「記憶(メモリ)」です。
多くの創業者は「LLM推論=最大コスト」だと思いがちです。
しかしAIコンパニオンでは、長期運用に入った瞬間から メモリ(長期記憶)の維持費 がじわじわ支配的になります。
- 会話が深くなるほど、記憶の検索と再注入が増える
- 記憶を書き込むほど、ベクトルDBや保存コストが積み上がる
- その結果、遅延(レイテンシ)が増え、より高価な構成へ押し上げられる
- 利益率(マージン)が「気づかないうちに」削れる
この“静かなコストセンター”が、AIコンパニオン事業を壊す典型パターンです。
収益化の全体像(この話の前提)
👉 https://lizlis.ai/blog/how-ai-companion-apps-make-money-and-why-most-fail-2026/
1) 記憶コストは「ユーザー数」ではなく「時間」に比例する
推論コストは分かりやすいです。
メッセージが増えればトークンが増え、だいたい線形に伸びます。
一方、記憶コストは非線形です。
保持した会話が増えるほど、毎ターンの処理が増えます。
- プロンプトが長くなる(トークン膨張)
- 記憶検索(retrieval)が増える
- 埋め込み(embedding)と再埋め込みが増える
- ストレージとインデックス更新が積み上がる
- 遅延が増え、体感品質が落ちる
新規ユーザーは安い。
1年続く忠実ユーザーは高い。
この構造のせいで、AIコンパニオンのユニットエコノミクスは
「成長が止まっても、時間経過で悪化する」ことが起きます。
2) AIコンパニオンの主要メモリアーキテクチャ(2026)とコスト特性
日本ユーザーが気にするのは実務的にここです。
「記憶がある/ない」ではなく どの方式で、何を犠牲にしているか が体験と価格を決めます。
A. ロール文脈(短い履歴だけ)=安いが脆い
短い会話ウィンドウ(rolling context)だけに依存する方式です。
ウィンドウから落ちた情報は、実質忘れます。
メリット
- 低コスト
- 低レイテンシ
- スケールしやすい
デメリット
- 長期連続性が壊れる(「前に言ったのに…」)
- 感情的な信頼が育ちにくい
例として語られやすいのが Character.AI:
https://character.ai
スケールと速度を優先しやすい一方で、記憶のリセットや想起のムラが“体感”として出やすい方式です。
B. 強めの要約(サマリ)=中コストだが、記憶が曖昧になる
会話を要約して、少ないトークンで再注入する方式です。
メリット
- トークン膨張を抑えられる
- “雰囲気の連続性”は維持しやすい
デメリット
- 事実が削れる(固有名詞、日時、条件)
- 要約ドリフト(少しずつズレる)
- 「覚えてるけど正確じゃない」体験になる
例:Nomi
Index
感情の一貫性は保ちやすい一方で、細部の精度が落ちやすいのが典型です。
C. 深い長期記憶(ユーザー管理含む)=高精度だが高リスク
メモリを濃く残し、ノート/ジャーナル等でユーザーが管理できる方式です。
メリット
- 体感の“覚えてる感”が強い
- 長期関係性に向く
デメリット
- ノイズが溜まる(どうでもいい・誤った情報)
- キュレーションしないとコストが急増
- “覚えすぎ問題”(期待値・プライバシーの不安)も出る
例:Kindroid
https://kindroid.ai
「深い記憶」は強い差別化ですが、放置すると高コスト+高ノイズになります。
3) なぜ「無制限チャット」の経済が壊れるのか(記憶が止まらない)
サブスクのARPUには上限があります。
しかしメモリコストには上限がありません。
- 料金は月額で頭打ち
- 記憶は会話が続く限り増える
- 検索・再注入・保存が積み上がる
結果として、
- ヘビーユーザーほど利益が薄くなる
- 長期リテンションがマージンを悪化させる
- 「無制限」は必ずどこかで回収が必要になる
多くのアプリが採る“静かな対策”は以下です。
- サイレントな記憶リセット
- プロフィール項目だけ覚える(会話は捨てる)
- 事実記憶は捨てて、感情だけ残す(雰囲気メモリ)
ただしユーザーは遅かれ早かれ気づきます。
ここで「裏切り感」→「危険性(依存の反動)」→炎上、が起きやすい。
4) 賢いアプリがやっていること:意図的に“忘れる”設計
持続可能なメモリは「全部覚える」ではなく、
どう忘れるかを設計することです。
(1) メモリの階層化(Memory Tiering)
- 短期:直近の会話だけをプロンプトに入れる
- 中期:要約で圧縮して保持
- 長期:構造化した事実だけを疎に検索(sparse retrieval)
古いデータは減衰(decay)またはアーカイブされます。
(2) イベントベースの書き込み(全部保存しない)
保存するのは“高シグナル”だけに限定します。
- 好み(食べ物、言葉遣い)
- 重要な訂正(呼び方、関係性)
- 目標(転職、試験)
- 関係を定義する出来事
雑談ログは捨てる。
これだけで、書き込み量と検索量が大きく下がります。
(3) 生ログではなく「構造化状態(state)」を持つ
会話を再生するのではなく、必要な情報を状態として持ちます。
- ユーザープロフィール
- 物語状態(シーン、進行)
- 関係フラグ(境界、NG、親密度)
これなら「会話全ログを毎回再注入」より圧倒的に安い。
5) 日本ユーザー向け:記憶が欲しい人の“失敗しない選び方”
「おすすめはどれ?」の前に、記憶タイプを見極めるのが安全です。
記憶が弱いと感じた時に見るポイント
- 長期会話で「前提」が維持されるか
- 具体(固有名詞・日時)が残るか、雰囲気だけか
- 新しいチャットにすると一気にゼロになるか
- 記憶の範囲が説明されているか(透明性)
記憶が強いほど良いとは限りません。
強い記憶はコストだけでなく、「覚えすぎが怖い」「依存が強まる」などの危険性(リスク)も上がります。
6) Lizlisはどこに位置するか:コンパニオン×ストーリーの中間(記憶を“物語価値”にする)
Lizlisは、AIコンパニオンとAIストーリーの中間に意図的に位置します。
https://lizlis.ai
設計の要点:
- 1日50メッセージ上限でメモリ膨張を制御
- 会話ログを無限に溜めるより、物語状態(ナラティブstate)を追跡
- “全部保存”ではなく、ストーリー継続に必要な情報だけを記憶
- 短期の会話と、長期の物語メモリを分離して期待値を合わせる
「無限の会話記録」を目指すより、
会話を“進むストーリー”として設計することで、
メモリコストが無限に複利で増える罠を避けます。
カテゴリ比較(基礎地図):
👉 https://lizlis.ai/blog/ai-companions-vs-ai-chatbots-vs-interactive-storytelling-2026/
まとめ:忘れ方を設計しないと、コストが全部覚えてしまう
推論コストは見えます。
記憶コストは見えません。
しかし記憶コストは、
- 会話が深いほど
- 長く続くほど
- 感情が強いほど 増えます。
設計を誤ると、事業はだいたい次の3択になります。
- 値上げする
- 体験を劣化させる(記憶を弱くする)
- 維持できず終了する
勝ち筋は「全部覚える」ではなく、
有限でキュレーションされた記憶を作ることです。
結論:
忘れ方を設計しない限り、あなたのコストが“すべて”を覚えます。