Source code for atloop.memory.compressor

"""Memory compressor for preventing unbounded growth."""

import json
import logging
from difflib import SequenceMatcher
from typing import Any, Dict, List

from atloop.memory.state import AgentState

logger = logging.getLogger(__name__)



[docs]
class MemoryCompressor:
    """Compress old memory to prevent unbounded growth."""

    # Default configuration (will be overridden by config if provided)
    # These are kept for backward compatibility
    ATTEMPTS_KEEP_RECENT = 10
    DECISIONS_KEEP_RECENT = 5
    IMPORTANT_DECISIONS_KEEP = 20
    MILESTONES_KEEP = 20
    LEARNINGS_KEEP = 10


[docs]
    @staticmethod
    def compress_if_needed(state: AgentState, memory_config=None, llm_client=None) -> bool:
        """
        Compress memory if it exceeds limits.

        Phase 4: Enhanced with LLM compression and deduplication.

        Args:
            state: Agent state
            memory_config: Optional MemoryConfig instance (if None, uses defaults)
            llm_client: Optional LLMClient for LLM compression (if None, LLM compression is skipped)

        Returns:
            True if compression was performed, False otherwise
        """
        # Use config values if provided, otherwise use defaults
        if memory_config:
            attempts_keep = memory_config.attempts_keep_recent
            decisions_keep = memory_config.decisions_keep_recent
            important_decisions_keep = memory_config.important_decisions_keep
            milestones_keep = memory_config.milestones_keep
            learnings_keep = memory_config.learnings_keep
        else:
            attempts_keep = MemoryCompressor.ATTEMPTS_KEEP_RECENT
            decisions_keep = MemoryCompressor.DECISIONS_KEEP_RECENT
            important_decisions_keep = MemoryCompressor.IMPORTANT_DECISIONS_KEEP
            milestones_keep = MemoryCompressor.MILESTONES_KEEP
            learnings_keep = MemoryCompressor.LEARNINGS_KEEP

        compressed = False

        # 1. Based-rule compression (existing logic)
        # Compress attempts
        if len(state.memory.attempts) > attempts_keep:
            MemoryCompressor._compress_attempts(state, attempts_keep)
            compressed = True

        # Compress decisions
        if len(state.memory.decisions) > decisions_keep:
            MemoryCompressor._compress_decisions(state, decisions_keep)
            compressed = True

        # Trim important_decisions (keep most recent)
        if len(state.memory.important_decisions) > important_decisions_keep:
            state.memory.important_decisions = state.memory.important_decisions[
                -important_decisions_keep:
            ]
            logger.info(
                f"[MemoryCompressor] 修剪 important_decisions 到 {important_decisions_keep} 个"
            )
            compressed = True

        # Trim milestones (keep most recent)
        if len(state.memory.milestones) > milestones_keep:
            state.memory.milestones = state.memory.milestones[-milestones_keep:]
            logger.info(f"[MemoryCompressor] 修剪 milestones 到 {milestones_keep} 个")
            compressed = True

        # Trim learnings (keep most recent)
        if len(state.memory.learnings) > learnings_keep:
            state.memory.learnings = state.memory.learnings[-learnings_keep:]
            logger.info(f"[MemoryCompressor] 修剪 learnings 到 {learnings_keep} 个")
            compressed = True

        # Phase 4: 2. LLM compression (if enabled and threshold exceeded)
        if memory_config and memory_config.llm_compression_enabled and llm_client:
            try:
                # Estimate memory size by generating a summary with very large limit
                from atloop.memory.summarizer import MemorySummarizer

                memory_summary = MemorySummarizer.summarize(
                    state, max_length=999999, task_goal=None
                )
                memory_size = len(memory_summary)

                if memory_size > memory_config.llm_compression_threshold:
                    logger.info(
                        f"[MemoryCompressor] Memory size ({memory_size} chars) exceeds LLM compression threshold ({memory_config.llm_compression_threshold}), triggering LLM compression"
                    )
                    MemoryCompressor._compress_with_llm(state, memory_config, llm_client)
                    compressed = True
            except Exception as e:
                logger.warning(
                    f"[MemoryCompressor] LLM compression failed: {e}, continuing with rule-based compression only"
                )

        # Phase 4: 3. Deduplication (if enabled)
        if memory_config and memory_config.deduplication_enabled:
            try:
                if MemoryCompressor._deduplicate_memory(state, memory_config):
                    compressed = True
            except Exception as e:
                logger.warning(
                    f"[MemoryCompressor] Deduplication failed: {e}, continuing without deduplication"
                )

        # Phase 5: Compress modified files content (handled in AgentLoop._compress_modified_files_if_needed)
        # This is called automatically after each file modification, so we don't need to do it here

        return compressed


    @staticmethod
    def _compress_attempts(state: AgentState, keep_recent: int = None) -> None:
        """Compress old attempts, keeping only recent ones."""
        if keep_recent is None:
            keep_recent = MemoryCompressor.ATTEMPTS_KEEP_RECENT
        if len(state.memory.attempts) <= keep_recent:
            return

        recent = state.memory.attempts[-keep_recent:]
        old = state.memory.attempts[:-keep_recent]

        # Generate summary of old attempts
        summary = MemoryCompressor._summarize_attempts(old)

        # Create compressed record
        compressed_record = {
            "step": 0,
            "type": "compressed",
            "summary": summary,
            "original_count": len(old),
            "compressed_at_step": state.step,
            "files": [],  # No files in compressed record
            "success": None,  # Mixed results
            "results": [],
        }

        # Replace with compressed + recent
        state.memory.attempts = [compressed_record] + recent
        logger.info(
            f"[MemoryCompressor] 压缩了 {len(old)} 个旧 attempts，保留 {len(recent)} 个最近的"
        )

    @staticmethod
    def _compress_decisions(state: AgentState, keep_recent: int = None) -> None:
        """Compress old decisions, keeping only recent ones."""
        if keep_recent is None:
            keep_recent = MemoryCompressor.DECISIONS_KEEP_RECENT
        if len(state.memory.decisions) <= keep_recent:
            return

        recent = state.memory.decisions[-keep_recent:]
        old = state.memory.decisions[:-keep_recent]

        # Generate summary of old decisions
        summary = MemoryCompressor._summarize_decisions(old)

        # Add summary to learnings
        learning_entry = f"[Step {state.step}] 历史决策总结: {summary}"
        state.memory.learnings.append(learning_entry)

        # Keep only recent decisions
        state.memory.decisions = recent
        logger.info(
            f"[MemoryCompressor] 压缩了 {len(old)} 个旧 decisions，保留 {len(recent)} 个最近的"
        )

    @staticmethod
    def _summarize_attempts(attempts: List[Dict[str, Any]]) -> str:
        """Summarize a list of attempts."""
        if not attempts:
            return "无历史尝试"

        total = len(attempts)
        successful = sum(1 for a in attempts if a.get("success", False))
        files_modified = set()
        tools_used = set()

        for a in attempts:
            files_modified.update(a.get("files", []))
            for result in a.get("results", []):
                tools_used.add(result.get("tool", "unknown"))

        return (
            f"历史 {total} 次尝试：成功 {successful} 次，"
            f"修改了 {len(files_modified)} 个文件，使用了 {len(tools_used)} 种工具"
        )

    @staticmethod
    def _summarize_decisions(decisions: List[Dict[str, Any]]) -> str:
        """Summarize a list of decisions."""
        if not decisions:
            return "无历史决策"

        total = len(decisions)
        total_actions = sum(len(d.get("actions", [])) for d in decisions)

        return f"历史 {total} 个决策，共执行了 {total_actions} 个动作"

    # Phase 4: LLM Compression

    @staticmethod
    def _compress_with_llm(state: AgentState, memory_config, llm_client) -> None:
        """
        Use LLM to compress old memory history.

        Args:
            state: Agent state
            memory_config: MemoryConfig instance
            llm_client: LLMClient instance for compression
        """
        # Keep recent N decisions (configurable, default 10)
        recent_count = 10
        if len(state.memory.decisions) <= recent_count:
            return

        old_decisions = state.memory.decisions[:-recent_count]
        recent_decisions = state.memory.decisions[-recent_count:]

        if not old_decisions:
            return

        logger.info(f"[MemoryCompressor] 开始 LLM 压缩: {len(old_decisions)} 个旧决策")

        try:
            # Build compression prompt
            # Limit the data size to avoid exceeding LLM context
            max_data_size = 50000  # 50KB of decision data
            decisions_json = json.dumps(old_decisions, ensure_ascii=False, indent=2)
            if len(decisions_json) > max_data_size:
                # Truncate if too large
                decisions_json = decisions_json[:max_data_size] + "\n... [数据已截断]"

            compression_prompt = f"""请将以下历史决策压缩为简洁的摘要，保留关键信息：

{decisions_json}

要求：
1. 保留任务目标、关键决策、重要里程碑
2. 移除重复和冗余信息
3. 保留工具执行结果的关键信息（错误、成功状态）
4. 摘要长度控制在 {memory_config.llm_compression_target // 2} 字符以内
5. 使用结构化格式（Markdown）

输出格式：
## 压缩摘要
[摘要内容]

## 关键信息
- 任务目标：...
- 关键决策：...
- 重要里程碑：..."""

            # Call LLM for compression
            # Use a simple completion call (not plan_and_act)
            # lexilux 2.1.0: complete(messages, *, system=..., params=ChatParams, **kwargs)
            from lexilux import ChatParams

            chat_params = ChatParams(temperature=0.3, max_tokens=4000)

            # Use LLM client's chat directly
            result = llm_client.chat.complete(
                compression_prompt,
                system="你是一个记忆压缩专家。请将历史决策压缩为简洁的摘要，保留关键信息。",
                params=chat_params,
            )

            compressed_summary = result.text

            # Create compressed record
            compressed_record = {
                "type": "llm_compressed",
                "summary": compressed_summary,
                "original_count": len(old_decisions),
                "compressed_at_step": state.step,
                "compression_target": memory_config.llm_compression_target,
            }

            # Replace with compressed + recent
            state.memory.decisions = [compressed_record] + recent_decisions
            logger.info(
                f"[MemoryCompressor] ✅ LLM 压缩完成: {len(old_decisions)} 个决策压缩为摘要，保留 {len(recent_decisions)} 个最近的"
            )

        except Exception as e:
            logger.error(f"[MemoryCompressor] LLM 压缩失败: {e}，回退到基于规则的压缩")
            # Fallback to rule-based compression
            MemoryCompressor._compress_decisions(state, recent_count)

    # Phase 4: Deduplication

    @staticmethod
    def _deduplicate_memory(state: AgentState, memory_config) -> bool:
        """
        Deduplicate similar memory items.

        Args:
            state: Agent state
            memory_config: MemoryConfig instance

        Returns:
            True if deduplication was performed, False otherwise
        """
        deduplicated = False

        # Deduplicate decisions
        if len(state.memory.decisions) > 1:
            unique_decisions = []
            seen_signatures = set()

            for decision in state.memory.decisions:
                signature = MemoryCompressor._get_decision_signature(decision)
                if signature not in seen_signatures:
                    seen_signatures.add(signature)
                    unique_decisions.append(decision)
                else:
                    # Check similarity with existing decisions
                    similar = False
                    for existing in unique_decisions:
                        similarity = MemoryCompressor._calculate_similarity(decision, existing)
                        if similarity >= memory_config.deduplication_similarity_threshold:
                            # Merge similar decisions (keep the more recent one)
                            similar = True
                            break

                    if not similar:
                        # Not similar enough, keep it
                        unique_decisions.append(decision)
                    else:
                        deduplicated = True

            if deduplicated:
                original_count = len(state.memory.decisions)
                state.memory.decisions = unique_decisions
                logger.info(
                    f"[MemoryCompressor] 去重完成: {original_count} 个决策 -> {len(unique_decisions)} 个唯一决策"
                )

        # Deduplicate attempts (similar logic)
        if len(state.memory.attempts) > 1:
            unique_attempts = []
            seen_attempt_signatures = set()

            for attempt in state.memory.attempts:
                # Skip compressed records
                if attempt.get("type") == "compressed" or attempt.get("type") == "llm_compressed":
                    unique_attempts.append(attempt)
                    continue

                signature = MemoryCompressor._get_attempt_signature(attempt)
                if signature not in seen_attempt_signatures:
                    seen_attempt_signatures.add(signature)
                    unique_attempts.append(attempt)
                else:
                    # Check similarity
                    similar = False
                    for existing in unique_attempts:
                        if existing.get("type") in ["compressed", "llm_compressed"]:
                            continue
                        similarity = MemoryCompressor._calculate_attempt_similarity(
                            attempt, existing
                        )
                        if similarity >= memory_config.deduplication_similarity_threshold:
                            similar = True
                            break

                    if not similar:
                        unique_attempts.append(attempt)
                    else:
                        deduplicated = True

            if deduplicated:
                original_count = len(state.memory.attempts)
                state.memory.attempts = unique_attempts
                logger.info(
                    f"[MemoryCompressor] 去重完成: {original_count} 个尝试 -> {len(unique_attempts)} 个唯一尝试"
                )

        return deduplicated

    @staticmethod
    def _get_decision_signature(decision: Dict[str, Any]) -> str:
        """Get a signature for a decision (for deduplication)."""
        # Create signature from key fields
        step = decision.get("step", "")
        thought = decision.get("thought_summary", "")[:50]  # First 50 chars
        actions_count = len(decision.get("actions", []))
        stop_reason = decision.get("stop_reason", "")

        return f"{step}:{thought}:{actions_count}:{stop_reason}"

    @staticmethod
    def _get_attempt_signature(attempt: Dict[str, Any]) -> str:
        """Get a signature for an attempt (for deduplication)."""
        step = attempt.get("step", "")
        files = sorted(attempt.get("files", []))
        files_str = ",".join(files[:5])  # First 5 files
        success = attempt.get("success", False)

        return f"{step}:{files_str}:{success}"

    @staticmethod
    def _calculate_similarity(decision1: Dict[str, Any], decision2: Dict[str, Any]) -> float:
        """Calculate similarity between two decisions (0.0-1.0)."""
        # Compare key fields
        thought1 = str(decision1.get("thought_summary", ""))
        thought2 = str(decision2.get("thought_summary", ""))

        actions1 = decision1.get("actions", [])
        actions2 = decision2.get("actions", [])

        # Calculate text similarity for thought_summary
        if thought1 and thought2:
            similarity = SequenceMatcher(None, thought1, thought2).ratio()
        else:
            similarity = 0.0

        # Boost similarity if actions are similar
        if actions1 and actions2:
            # Simple comparison: same number of actions and same tools
            tools1 = [a.get("tool", "") for a in actions1 if isinstance(a, dict)]
            tools2 = [a.get("tool", "") for a in actions2 if isinstance(a, dict)]
            if tools1 == tools2:
                similarity = min(1.0, similarity + 0.2)

        return similarity

    @staticmethod
    def _calculate_attempt_similarity(attempt1: Dict[str, Any], attempt2: Dict[str, Any]) -> float:
        """Calculate similarity between two attempts (0.0-1.0)."""
        # Compare files modified
        files1 = set(attempt1.get("files", []))
        files2 = set(attempt2.get("files", []))

        if not files1 and not files2:
            return 1.0  # Both empty

        if not files1 or not files2:
            return 0.0

        # Jaccard similarity
        intersection = len(files1 & files2)
        union = len(files1 | files2)

        if union == 0:
            return 1.0

        return intersection / union