CacheFriendlyMemory

A SillyTavern extension that provides automatic, hierarchical context compression for long-running roleplay chats.

Features

Hierarchical Compression: Progressive compression across 4 levels (raw → short-term → long-term → ultra-compressed)
Auto-Compaction: Automatically compresses when message count or context threshold is reached
Compaction Progress UI: Real-time progress feedback during chat compaction with toast notifications
Cache-Friendly: Maintains prompts stable to optimize caching
Non-Destructive: Original messages preserved, only marked as summarized
Configurable: User-adjustable thresholds, chunk sizes, and compression models
Per-Chat Storage: Data persists with chat file, follows branches

Installation

Download this extension to your SillyTavern extensions folder:
- For all users: public/scripts/extensions/third-party/CacheFriendlyMemory
- For current user: data/<user-handle>/extensions/CacheFriendlyMemory
Enable the extension in SillyTavern's Extensions menu

Usage

Automatic Compaction

By default, the extension will automatically compress chat history when:

Unsummarized messages exceed the threshold (default: 120)
Context usage exceeds the threshold (default: 75%)

Manual Compaction

Use slash commands to manually control compaction:

/cfm-compact    Trigger compaction immediately
/cfm-status     Show compression statistics
/cfm-export     Export compression data to JSON

Configuration

Access settings in the Extensions menu under "CacheFriendlyMemory":

Enable Extension: Turn the extension on/off
Auto Compact: Enable/disable automatic compaction
Compact Threshold: Message count trigger (default: 120)
Context Threshold: Percentage trigger (default: 75%)
Level 1 Chunk Size: Messages per short-term summary (default: 10)
Level 2 Chunk Size: Summaries per long-term summary (default: 5)
Target Compression: Target compression ratio (default: 55%)
Connection Profile: Select a SillyTavern connection profile for summarization (or "None" to use the current profile)
- Note: Profiles must be configured in SillyTavern's Connection Manager
Enable Summary Injection: Inject summaries into LLM context instead of raw messages
Debug Mode: Enable verbose console logging for troubleshooting
Show Progress Bar: Display inline progress indicator in settings panel during compaction

Compaction Progress UI

When compaction is triggered (either manually or automatically), the extension provides real-time progress feedback:

Toast Notifications: A toast notification appears showing "Compacting: X/Y batches (Z%)" with a spinning icon
- The toast updates after each batch is processed
- Auto-dismisses when compaction completes or fails
Inline Progress (when Show Progress Bar is enabled): Progress displayed in the settings panel
- Shows current batch count and percentage
- Visible only when settings panel is open
Debug Logging (when Debug Mode is enabled): Detailed progress messages logged to console
- Tracks batch start, updates, and completion
- Helps troubleshoot compaction issues

The progress UI is non-blocking and won't delay compaction. If UI updates fail, compaction continues normally.

Message-Based Tracking

Extension now uses per-message metadata flags instead of internal counters:

Each message tracks its compression level (null|1|2|3)
Stats calculated dynamically from message flags
Summarized messages hidden from LLM context via generate interceptor
Summaries injected via extension prompts

Compression Levels

Level 0 (null): Active, uncompressed messages
Level 1: Short-term summaries (10 messages → 1 summary)
Level 2: Long-term summaries (5 L1 summaries → 1 L2 summary)
Level 3: Ultra-compressed story summary

Message Metadata Structure

message.extra = {
    cacheFriendlyMemory: {
        compressionLevel: null | 1 | 2 | 3,
        summaryId: string | null,
        included: boolean,
        timestamp: number | null
    }
}

Compression Strategy

Level 0 (Most Recent)    → Raw messages (0-120 messages)
Level 1 (Recent Past)     → Short-term summaries (10 messages → 1 summary)
Level 2 (Medium Past)     → Long-term summaries (5 L1 summaries → 1 L2 summary)
Level 3 (Distant Past)    → Ultra-compressed story summary

Key Principles

Append-Only: Never modify existing summaries, only append new ones
Message Preservation: Original messages kept, just marked as summarized
Chunk Merging: Small remainders merged up for quality
Predictable Format: [Chapter N] headers for caching and model comprehension
Targeted Compression: Compress only enough to hit target ratio

Storage

Global Settings: Stored in settings.json under extension_settings.cacheFriendlyMemory
Per-Chat Data: Stored in chat file under chat_metadata.cacheFriendlyMemory

Requirements

SillyTavern 1.0.0 or higher
Connection profile configured in SillyTavern's Connection Manager for summarization
Select a valid connection profile in the extension settings (or use "None" for the current profile)

License

This extension is open-source.

Contributing

Contributions welcome! Please submit pull requests or issues on GitHub.

Name		Name	Last commit message	Last commit date
Latest commit History 63 Commits
.opencode/command		.opencode/command
__pycache__		__pycache__
docs		docs
i18n		i18n
openspec		openspec
presets		presets
src		src
templates		templates
tests		tests
ui		ui
.gitignore		.gitignore
AGENTS.md		AGENTS.md
CHANGELOG.md		CHANGELOG.md
README.md		README.md
TASK_3_SUMMARY.md		TASK_3_SUMMARY.md
TASK_5_SUMMARY.md		TASK_5_SUMMARY.md
TESTING.md		TESTING.md
eslint.config.js		eslint.config.js
global.d.ts		global.d.ts
index.js		index.js
manifest.json		manifest.json
package-lock.json		package-lock.json
package.json		package.json
test-correct.js		test-correct.js
verify_imports.py		verify_imports.py
vitest.config.js		vitest.config.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

CacheFriendlyMemory

Features

Installation

Usage

Automatic Compaction

Manual Compaction

Configuration

Compaction Progress UI

Message-Based Tracking

Compression Levels

Message Metadata Structure

Compression Strategy

Key Principles

Storage

Requirements

License

Contributing

About

Uh oh!

Releases

Packages

Languages

ctbk/CacheFriendlyMemory

Folders and files

Latest commit

History

Repository files navigation

CacheFriendlyMemory

Features

Installation

Usage

Automatic Compaction

Manual Compaction

Configuration

Compaction Progress UI

Message-Based Tracking

Compression Levels

Message Metadata Structure

Compression Strategy

Key Principles

Storage

Requirements

License

Contributing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages