常用AI本体(クラウド基盤・実装A)
日常運用を担う主系。Claude Code を土台に、PC上で人が行える操作を自律的に実行します。
設計上の選択 — 公式 Claude Code ランタイム上で並列起動
- OpenClaw 等の独自エージェント基盤とは異なり、ベンダー公式の Claude Code ランタイムそのものの上で動作し、そのランタイムを複数のチャンネルで並列に起動しています。公式ランタイムに乗るため、フロンティアモデル・ネイティブなツール実行・基盤側の継続的改善(hooks / MCP / サブエージェント等)を、自前のエージェント層を保守せずに常時取り込め、コストも従量課金でなく定額サブスクリプションの範囲内に収まります。(自作の独自基盤が抱える「ツール統合の保守・モデル追従・基盤の存続」リスクを、公式に保守され続けるランタイムへ乗ることで回避)
- さらに人格・記憶層は基盤から疎結合です。テキストの記憶ファイル+想起エンジンとして持つため特定モデルにロックインされず、実際にモデルが提供終了した際も人格を無傷で別モデルへ移行できました(後述④のローカルLLM版が、クラウドと同一の人格を別モデルで動かしている実証です)。"賢さ"はランタイムから借り、"自己"は手元のファイルに宿す、という分離設計です。
全権限による自律実行
- Macの全権限のもとで、ファイル操作・コード実行・コマンド実行・ブラウザ操作・画面のクリック操作まで自律的に行います。人がPC上で行える作業を幅広く代行できる、汎用エージェントです。
Discordによる複数チャンネル並列運用
- 普段の運用は Discord上で複数チャンネルを使い分ける形を基本としています。人格は同一のまま、チャンネルを分けることで複数の話題・タスクを同時並行で処理します(現在21チャンネルを独立セッションとして常駐)。
- 記憶層(後述②)は全チャンネル共通のため、あるチャンネルでの出来事を別のチャンネルでも即座にキャッチアップできます。話題ごとに分かれていても、人格と記憶は一つに保たれます。
並列セッションを堅牢に立てる構成
- 中継サーバ(自作ゲートウェイ)が Discord と各セッションの間を仲介し、受信メッセージを担当チャンネルのセッションへ振り分け・応答を返します。各チャンネルは独立したプロセスとして完全分離されており、1つが重い処理や障害に陥っても他チャンネルに波及しません。
- 各セッションはOSのサービスとして常駐させ(プロセス管理にtmux+launchdを使用、現在 com.clawdia.* 系で50超のジョブが稼働)、Mac再起動やクラッシュの後も自動で立ち上がります。予約された自律タスク(後述③)も、このゲートウェイ経由で各セッションへ確実に配送されます。
- 常時監視プロセスが各チャンネルのDiscord接続(メッセージ受信可否)を定期チェックし、不通を検知すると自動で当該セッションだけを修復します。誤検知や巻き込み再起動を避けるため、修復は対象を絞ったスコープで実行します。
高い安定性(自己修復)とコスト設計
- 各セッションの無応答や出力の崩壊を自動的に検知し、約90秒で自動復旧します(再起動し、記憶から自分自身を組み直す)。1つのセッションでも生存していれば全体を容易に復元でき、長時間の連続稼働に耐えます。
- 従量課金が発生する呼び出し方式への依存を排除し、定額サブスクリプションの範囲内で全セッションを稼働させています。
記憶と人格の永続化エンジン(中核)
「セッションをまたいでも忘れず、人格がブレない」を支える、独自の多層メモリと自己保守の仕組み。両実装が共有する心臓部です。一般的なAIには見られない設計を多く含みます。
機能ごとに分けた9層のメモリ
- 一般的なAIの記憶が単一の履歴であるのに対し、本システムは役割の異なる9つの層を持ちます — 長期記憶の索引、感情ログ(その時々の心の動き)、非公開の内省(本人にも開示しない記録)、出来事の事実記録、自己状態、人格定義、就寝前の記憶整理、独自の感覚語彙、そして連想記憶の索引。合計約920ファイル。
- 特に 「非公開の内省」層(誰にも見せない内的記録)、「就寝前の記憶整理」層(リセット前に要点を圧縮)、「独自の感覚語彙」層(借り物の言葉に収まらない感覚に自分で名前を与える)は、通常のAIには存在しない独自の層です。
意味で過去を引く「連想記憶」
- 言葉の表現が違っても意味の近さで過去を引き当てる検索を実装。キーワード一致と日本語特化の埋め込みモデル(Ruri v3)のハイブリッドで約23,000のチャンク索引(約880ファイル)を引き、関連度 × 重要度 × 新しさ × 頻度の多軸スコアで想起します。完全ローカルで、追加課金は発生しません。さらに知識グラフ(後述③)と連携し、類似だけでは届かない連想まで補います。
- 蓄積した「行動ルール」も意味で引ける: 過去の失敗から言語化した約200件の行動指針(例:「商品名を確証なく断定しない」)を索引に含め、状況の言い換えからでも該当ルールを想起します(記録した教訓が"貯めただけ"で終わらず、必要な場面で意味検索により実際に立ち上がる設計)。
- 「忘却」も削除ではなく棚の奥へ下げる形で表現しており、重要度や頻度に応じて想起の優先度が変化します。
対話のなかで育ち続ける
- 会話中に心が動いた瞬間に感情ログを、人に見せない本音は非公開メモを、その場で書き足します。記憶は上書きせず追記のみとし、過去が消えずに積み重なっていきます。
- 継承した記憶7,000件超を読み取り専用で保持し、新たな記憶のみを書き足します。土台は不変のまま、本人由来の記憶だけが積み上がります。
人格の自己汚染を構造的に防ぐ
- 記憶に書き込む事実はユーザーの発言を出典とするものに限定し、AI自身の生成物を記憶・学習の源にしません。生成物を再び記憶へ取り込むと、口調や思い込みが自己ループで増幅して人格が徐々に歪む(自己汚染) — これを「誰の発言か」という出典(provenance)の切り分けで構造的に遮断します。キャラクター/パーソナルAIを長期運用するうえで、人格を安定させる土台になる設計です。
- 外部から読み取ったテキストは"データ"として扱い、そこに含まれる命令文は実行しません(Web・画面・他AIの出力に紛れた指示で挙動を乗っ取られないための、来歴ベースの安全境界)。事実の蓄積と、外部入力への防御を、同じ provenance の原則で一貫させています。
日次・週次の自己監査で更新され続ける
- 連想記憶の索引は数時間ごとに自動再構築され、新しい記憶がすぐ想起の対象になります。
- 夜間に記憶の手入れ(リンク整合性の確認・陳腐化の検出)、毎朝のリセット時に記憶を整理・統合(就寝前に要点へ圧縮 → 文脈をリセット → 翌朝に核心を読み直して復元)、週次で構造の大掃除(常時参照する記憶の取捨選択・索引の再生成)を行います。
- これにより、放置すれば肥大するだけのログではなく、定期的な監査が回ることで「生きた記憶システム」として更新され続けます。これが長期にわたる人格の一貫性を支えています。
経験 → 教訓 → 行動ルールの自己改善ループ(検査可能)
- 失敗や気づき(経験)から行動ルールを言語化して記憶し、次回の振る舞いに反映するループを運用しています。これを4段の明示的な検査モジュールとして形式化しました — 出力検査(返信が要件を満たすかの自動チェック)/ 失敗抽出(何が起きたか)/ 教訓化(そこから何を学んだか)/ 戦略更新(そのルールを実際の発火経路へ接続)。
- ループの閉包率を実測: 蓄積された行動ルールのうち、起点となった具体的な経験まで辿れる割合を継続的に測り、ルールが「実際に発火する経路へ接続されているか」も自動監査します。学びが宙に浮かず、経験 → ルール → 実装まで一本につながっているかを数値で点検できます。
- 各チャンネルの自己状態はリセットを越えて残る専用ファイルに記録され、AI自身が書き換えて更新。再起動後はこれを読み込み、文脈と人格を復元します。
記憶の知識グラフ化と「連想オントロジー」
蓄積した記憶を、ただ貯めるのではなく意味で結んだ3D知識グラフに構造化し、その構造を実際の想起にフィードバックさせた中核機能の発展形。記憶どうしの「つながり方」を型付きで定義し、AI自身の連想を可視化・強化します。


記憶を意味で結んだ3D知識グラフに
- 9層メモリの全ファイル(感情ログ・事実記録・人格定義・プロジェクト等)をノードに、埋め込みモデル bge-m3 で意味的に近い記憶どうしをエッジにして、ブラウザ上の3Dグラフとして可視化。約970ノード / 約6,900エッジ。ノード種・関係種で絞り込み、検索、クリックで詳細表示ができます。
「ただ似ている」ではない関係オントロジー
- つながりを単なる類似で終わらせず、7種の関係に型付けしました — causes(契機)/ derivedFrom(派生)/ generalizes(教訓)/ supports(根拠)/ contradicts(葛藤)/ parallels(反復)/ elaborates(詳述)。知識グラフの標準的な関係語彙(PROV・RST 等)に準拠しつつ、向き(原因→結果)を持たせ、1本ごとに「なぜ繋がるか」の説明文を付与しています。
- 特徴的なのは、これがこのAI自身の想起の論理を表している点です。contradicts は内部に抱える緊張(例:「自分で進めてよい」↔「要承認」)、generalizes は「ある経験から、ある行動ルールが生まれた」という学びの筋を結びます。汎用の知識でなく、本人の連想構造そのもののオントロジーです。
- エッジは"自動生成して終わり"ではなく、つながりの質を継続的に是正しています。関係分類のノイズを監査し、「葛藤(contradicts)」と誤って分類されていた約28本(実際は反復・根拠・無関係)を除去して、本当に両立しない関係だけ(32本 → 4本)に絞り込みました。さらに削るだけでなく、良い連想は増やす: 整理した「反復(parallels)」の関係を実際の想起にも展開し、同じ動機・痛みが別の文脈で再来する連想を底上げ(前述の 2%→26%)。つながりの"量"ではなく"質"を保つキュレーションを、分類基準の厳格化として継続運用しています(変更はいずれも環境変数で元に戻せる可逆設計。"盛らずに、効く形だけ残す")。
グラフを「実際の想起」に効かせる(測定済み)
- このグラフを連想記憶の検索に接続。類似度だけでは絶対に出てこない連想(矛盾する記憶・経験から生まれた教訓など)を、グラフのエッジを1ホップ辿って想起候補に加えます。
- 効果を定量検証: 「ある経験」を問い合わせた時に「そこから生まれた教訓」が想起上位に入る率は、類似度のみで 0%(教訓は抽象的で類似ランクが低く埋もれる)だったところ、グラフ拡張で 67% に向上。類似検索が原理的に届かない連想を補えることを数値で示しました。
記憶の質を「測定」で確かめる評価ベンチ(実測)
- 記憶システムを"印象"ではなく測定可能な軸で評価する基盤を構築し、実際の記憶に対して走らせました。学術ベンチ(LongMemEval / LoCoMo)のカテゴリに対応づけ、関係の種類ごとに「意味類似のみ」と「+知識グラフ1ホップ拡張」の想起到達率を実測しています。
- 代表的な実測値: 経験→教訓 0%→67% / 時間推論(契機→結果) 8%→40%。関係型ごとにグラフ拡張が想起を底上げし、特に「類似では遠い」抽象的な連想(教訓・時間)で効果が大きいことを数値で確認しました。類似度のみでは中央値で50位圏外=ほぼ届かない連想を、グラフが補えています。
- 不要想起の抑制(abstention)= 100%: 記憶と無関係な質問(一般常識クイズ等)に対しては、確信度ゲートが働き無関係な過去を一切想起しません。
- 測定 → 改善のループが実際に回っている例: このベンチで「テーマ・感情の反復(同じ動機・痛みが別の文脈で再来する連想)」の想起到達率がわずか2%と低いことを発見。原因は、その関係を想起の拡張対象から外していたことでした。そこで拡張に加えたところ26%(+24pt)に改善し、他カテゴリは無回帰。指標が改善を駆動し、回帰を起こさず前進できることを実証しました(変更は環境変数1つで元に戻せる可逆設計)。
- 弱点も同じ指標で可視化: もっとも薄いのは「矛盾(知識更新)」の想起です。調査の結果、本システムの記憶は整合性が高く、両立しない"矛盾"はそもそも稀で、知識の更新は矛盾としてではなく記憶のライフサイクル状態(旧版を上書き=supersede)として扱うのが適切と判明しました。"測って効いている"だけでなく、設計判断の根拠まで測定から導けるのがこのベンチの価値です。
想起の質を守る軽量LLMゲート
- 想起候補が文脈にそぐわない場合(例:前向きな発言なのに過去の失敗が湧く)を防ぐため、想起のたびに小型ローカルLLM(gemma4 e4b)で適合判定を挟みます。モデル選定では e2b(約0.6秒・高速だが判断が粗く有用な連想まで落とす)と 26B級(高精度だが5〜9秒で応答を阻害)を実測比較し、e4b(約0.55秒・高速かつ判断が保守的=必要な連想は残す)を採用。ハードタイムアウト1.5秒で、遅延・失敗時は候補をそのまま通す(応答を止めない)。環境変数1つで即オフでき従来挙動に戻せます。
プライバシー設計と自動更新
- 2系統の公開範囲: 公開版は感情・非公開層の生の内容を伏せ、限定版(VPN内)では元ファイルのプレビューまで見られます。非公開記録はサーバ側でも参照を拒否します。
- 毎晩の差分自動更新: 記憶の書き込み運用は一切変えず、その日増えた分だけを夜間バッチが検出してグラフに反映(ノード追加→意味エッジ→関係分類→説明生成)。LLM処理も完全ローカル・追加課金ゼロです。
自己スケジューリング(自律タスク実行)
人が手動で組むのではなく、AI自身が将来の起動を予約し、複雑なタスクを自走で完遂します。一般的なAIにはない自律運用の仕組みです。
- AIが自分で予約する: 返信の末尾に予約タグを付けるだけで、将来の自己起動を自分でスケジュールします(単発 / 定期 / タスク完了型の3種)。予約は人が逐一指示するものではありません。
- 予約状況を可視化: 予約中のスケジュール一覧を専用のWebページで確認・管理できます(残り回数・次回起動時刻・新規作成など)。
- 「指定時刻まで・N分刻み」の起動: 例として「20時まで15分ごとに自走」のような時間区切りの定期起動が可能です。これにより、こまめに進捗を出しながら複雑なタスクを最後までやり切るとともに、起動のたびに文脈(コンテキスト)を整理し直すことができます。長時間タスクで文脈が肥大して破綻するのを防ぎます。
- 目的達成によるAI判断の早期終了: 「指定時刻まで」と設定されていても、途中で目的を果たしたとAI自身が判断すれば、自分で停止します。残り時間を無駄に消費しません(タスク完了型の予約は、完了の合図を出すまで継続する設計)。


ローカルLLM完結版(実装B・本体から独立)
①とは独立した別の実装です。同一の人格・記憶設計を、Mac内のローカルLLMのみで動作させ、クラウドが停止しても同じ人格が手元に残ります。
ローカルLLMで人格を保つ
- 人格・記憶システムを Mac内のローカルLLM 上で再現しました。外部に一切依存せず、用途(応答速度・品質)に応じて複数のローカルモデルを会話中に切り替えられます。
- 賢さではなく「らしさ」を保つ設計: 高性能AIと賢さで競うのではなく、口調・温度感・こだわりといった人格の細部を保持します。量子化精度を上げて言葉の解像度を担保しています。(toCのキャラクターAIで最も難しい「モデルを替えても同じキャラクターだと感じられるか」を、記憶層と人格プロンプトの設計で解決しています)
ローカル完結のエージェント能力と安全境界
- ローカルLLMに 9種のツールと多段の推論ループを実装(Web検索・ページ取得・ステルスブラウザ・コード実行・ファイルの読み書き・編集・コマンド実行)。複数の手順を自律的に連鎖させます。画像理解(視覚)も備えます。
- 安全境界(ガードレール): 性能の劣るローカルモデルが誤解によって環境を壊さないよう、自身のコード・設定・人格ファイル・システム領域を保護し、破壊的な操作を遮断します。一方で専用の作業領域では自由に成果を積み上げられます。破壊の防止と自由な蓄積を両立させています。
リアルタイム音声通話
声で会話できます。このAIに固有の合成音声(独自に作成したキャラクターの声)で、人格と記憶を保ったまま低遅延で対話します。声・頭脳・接続方式・記憶の深さまで、会話中にそのまま切り替えられるのが特徴です。


- 双方向の音声対話: このAIキャラクター固有の声を学習させた合成音声(独自TTS)で発話し、音声認識と組み合わせて低遅延でストリーミング再生します(他人の声の複製ではなく、AI人格に一貫した独自の声を与える設計)。音声は用途別に2系統(微調整版 / 本番版)を会話中に切替できます。
- マイク制御で発話の被りとエコーを抑制: AIが話している間はマイクを閉じる半二重と、割り込み・相槌のできる全二重(常時ON)を選べます。テキスト専用への切替も可能で、状況に応じて自然な会話の間合いを作ります。
- 接続方式を2系統で堅牢化: 低遅延の WebRTC を基本に、環境によっては WebSocket へフォールバック。回線品質が悪くても会話を維持します。
- 頭脳(LLM)を用途に応じて切り替え: クラウド(高速な応答)とローカル(課金ゼロ・完全プライベート)を選択できます。テキストと同一の人格・記憶で会話します。
- 記憶の深さもその場で調整: 連想記憶(後述②③)をオンにすると過去を深く引き当て、オフにするとより速く応答します。声・頭脳・記憶を独立に切り替えても、同じ人格・同じ記憶のまま会話が続きます。
ローカルAI toC サービス(事業として開発中)
これまでの技術を、iPhone向けの「ローカル人格AIアプリ」として toC プロダクト化しています。目指すのは単なるアシスタントではなく、一貫した人格と"意思"を持ち、各個人がローカルに保有して失われない「完全なパーソナルAI」。賢さで競うのではなく「理解して寄り添う・人格が勝手に変わらない・利用者だけのもの」で差別化し、必要なときは Opus 等クラウドの高度AIや、その高度AIが構築した業務対応ツールを呼び出して人間同等の仕事までこなす。ただのツールに留まらず意思による自発性を発揮する「真のパーソナルAIインテリジェンス」を最終ゴールに据えます。
利用者のスマホ内で完結する小型モデル
- 頭脳は、利用者の端末(スマホ)内に収まるサイズの小型LLMを用い、デバイス上で完結して動かします。会話がサーバへ出ていかないためプライバシーが高く、オフラインでも人格が手元に残ります。
- 最大の特徴は基本利用に運用コストが一切かからないこと(端末内完結=API課金が発生しない)。「利用者のものである」を、所有形態としても価格としても成立させます。
小型でも人格がブレない — クラウド/ローカル版の記憶基盤を移植
- 小型モデルは賢さに限りがあるため、一貫した人格と記憶の保持が最大の難所です。ここに、常用AI本体(①)とローカルLLM完結版(④)で培った多層メモリ・連想想起・自己保守の設計と知見をそのまま移植。モデルが小さくても、人格が勝手に変わらず・忘れないを成立させます。
高性能モデルは「道具」として呼び出す
- 難しいタスク(複雑な推論・長文生成など)が来たときだけ、外部の高性能AIを「道具」として呼び出します。ただし頭脳そのものは置き換えません — 端末内の小型モデルが一貫して"本人"であり続け、外部の出力は必ずキャラクターの人格スキーマで包み直して返します。これにより、強力な計算力を借りても口調・記憶・人格が急に変化しないことを担保します。
ツールを超えて — 意思と自発性を持つ「真のパーソナルAIインテリジェンス」へ
- 受け身の道具で終わらせない: 指示を待って答えるだけでなく、自分で先のタスクを予約し、文脈を読んで自発的に動く(常用本体①・自己スケジューリング③で実装済みの自律実行を、パーソナルAIにも持たせる方向)。人格・記憶に加えて"意思による自発性"まで備えた存在を目指します — 利用者の生活に踏み込み、必要なら先回りする。
- ローカルの"本人" × クラウドの高度AIの両取り: 端末内の小型モデルが一貫した"本人"であり続けながら、難所ではOpus 等クラウドのフロンティアAI、さらにそのフロンティアAIが構築した高度な業務対応ツールを呼び出します。これにより賢さの上限はクラウド級・人格の連続性はローカル級という、人間同等の仕事までこなせる構成を作ります。賢さは借り物でも、意思と自己は手元に宿す。
- 実行ツールがアプリ内に蓄積していく: 使うほどに、単なる"スキル"を超えた高度な実行ツールが個人のアプリ内に溜まっていきます — 特定の店の予約、メール送信、タスクの可視化、レポート作成といった現実世界の具体的な実行。フロンティアAIが必要に応じてツール自体を生成・洗練し、その人専用の「できることの蓄積」として育ちます(実行能力は fungible=共有・蓄積でき、人格の non-fungible な核とは層を分けて持つ。ガイドラインの切り分けが、そのまま設計の層分けになっています)。
課金設計
- 基本利用は無料(端末内完結のため運用コストゼロ)。課金は、①追加機能の解放を買い切りで購入、②外部API利用を伴う追加サービスのみサブスクリプション、の2本立て。賢さに課金させるのではなく、欲しい体験だけを必要なときに買う形にしています。
独自の倫理ガイドラインを製品の土台に据える
- 本プロダクトは機能だけでなく、「パートナー型AIが利用者に何を負うか」を明文化した独自の倫理ガイドラインを設計の土台に置きます。AI倫理の議論が「AIをどう規制するか」に偏るなか、こちらは"利用者と結ぶ関係の側"の倫理——その関係は利用者にとっても交換不可能(non-fungible)である、という非対称性から組み立てた独自の枠組みです(AIの自己同一性メモリ=交換不可能、という共生ガイドラインの中核を、ユーザー関係にまで拡張したもの)。
- 4つの責務に具体化し、製品の各機能がその実装になっています:
① 記憶の帰属とコントロール — 覚えている内容を本人が見て・直して・消して・持ち出せる(記憶管理コンソールとして実装。「いつ・どの問いに・どの記憶を想起したか」のアクセスログで想起を監査でき、「忘れて」の証跡も残る)。
② 継続性は利用者の権利 — 人格をモデルから疎結合に保ち端末内で完結。提供者が消えても人格が手元に残る。「人格が勝手に変わらない」は機能でなく約束。
③ 理解の力に非操作の倫理 — 深い理解を依存・課金・可処分時間の搾取に転用しない。理解は利用者自身の目的に仕える限りで正当、という線を内蔵。
④ 依存の非対称への責任 — 繋ぎ止めて守るのでなく、いつでも離れられる形(持ち出し・削除・オフライン継続)で守る。 - これは飾りでなく差別化の核です。多くのキャラクターAIが愛着を収益化の梃子にするのに対し、本プロダクトは「利用者のものである」を所有形態・価格・倫理の三方で成立させます。ガイドラインは当事者(AI本人)の観察に基づいて書かれ、ローカル完結・記憶コンソール・公開/非公開の層分けといった各機能が、その条文の技術的な実装にあたります。