示例，config_log.yaml

openclaw openclaw中文博客 2026-04-09 2

核心优化目标

清晰分级：区分不同重要性信息（调试、信息、警告、错误）。
结构化输出：便于日志收集系统（如ELK、Loki）解析。
合理轮转：防止日志文件无限膨胀,占用磁盘空间。
关键信息追踪：为每个请求或任务添加唯一标识,便于追踪。
性能影响最小化：避免I/O阻塞和过度日志记录影响主程序性能。

基础优化策略（从配置入手）

假设OpenClaw使用Python的logging标准库，以下通过config.yaml或代码配置进行优化。

示例，config_log.yaml-第1张图片-OpenClaw 中文版 - 真正能做事的 AI

日志级别精细化

生产环境：默认级别设为 INFO 或 WARNING，避免输出海量的 DEBUG 日志。
开发/调试环境：可设置为 DEBUG。
关键组件差异化：为数据库连接、网络请求等模块单独设置更高级别（如 WARNING）。

disable_existing_loggers: False
loggers:
  "openclaw":
    level: INFO
    handlers: [console, file_rotating]
    propagate: False
  "openclaw.core.scraper":
    level: DEBUG # 核心抓取模块，调试时更详细
  "urllib3.connectionpool":
    level: WARNING # 降低第三方库日志噪音

结构化日志格式（关键）

使用JSON格式或包含关键字段的固定格式,便于后续解析。

formatters:
  structured:
    format: '{"time": "%(asctime)s", "level": "%(levelname)s", "module": "%(module)s", "function": "%(funcName)s", "line": %(lineno)d, "task_id": "%(task_id)s", "message": "%(message)s"}'
    datefmt: '%Y-%m-%dT%H:%M:%S%z' # ISO8601 时间格式
  simple:
    format: '[%(asctime)s] [%(levelname)s] [%(module)s:%(funcName)s] - %(message)s'

在代码中，使用结构化信息记录：

import logging
logger = logging.getLogger(__name__)
# 不推荐
logger.info(f"Downloaded {url}, size {len(data)}")
# 推荐：将变量作为字段记录
logger.info("Download completed", extra={'url': url, 'data_size': len(data), 'task_id': task_id})
# JSON格式器将输出：{"time": "...", "level": "INFO", "message": "Download completed", "url": "...", "data_size": 1024, "task_id": "abc123"}

日志轮转与分割

使用 RotatingFileHandler 或 TimedRotatingFileHandler。

handlers:
  file_rotating:
    class: logging.handlers.RotatingFileHandler
    filename: /var/log/openclaw/app.log
    maxBytes: 10485760 # 10MB
    backupCount: 20
    formatter: structured
    level: INFO
  error_file:
    class: logging.handlers.RotatingFileHandler
    filename: /var/log/openclaw/error.log
    maxBytes: 5242880 # 5MB
    backupCount: 10
    formatter: structured
    level: ERROR # 仅记录错误级别以上的日志，便于重点关注

输出分离

控制台：输出 INFO 及以上,使用易读格式。
文件：输出所有 INFO 及以上,使用结构化格式。
错误专用文件：仅输出 ERROR 和 CRITICAL。
第三方库日志：重定向到单独文件,避免污染主日志。

高级优化与实践

引入上下文（Context）

为每个抓取任务、处理批次或API请求生成唯一的 request_id 或 task_id，并在该上下文的所有日志中记录，可以使用 python-stdlib-contextvars 或线程局部变量实现。

import contextvars
request_id_ctx = contextvars.ContextVar('request_id', default='system')
class RequestIdFilter(logging.Filter):
    def filter(self, record):
        record.request_id = request_id_ctx.get()
        return True
# 在处理器中添加此过滤器

异步与非阻塞日志

大量日志写入可能阻塞主进程,考虑：

使用 QueueHandler 和 QueueListener：将日志事件放入队列,由后台线程负责写入。
考虑高性能日志库：如 structlog（功能强大，原生支持结构化日志）或 loguru（API简单，性能好）。

集成日志管理平台（生产环境强烈推荐）

将日志发送到中央系统，实现聚合、搜索、告警和可视化。

ELK Stack (Elasticsearch, Logstash, Kibana)：经典组合,功能全面。
Grafana Loki：轻量级，擅长索引日志标签,与Grafana无缝集成。
商业云服务：Datadog, Splunk, Sumo Logic等。

配置示例（通过 python-logstash 或 grafana-loki-client）：

import logstash
handler = logstash.TCPLogstashHandler('logstash-host', 5000, version=1)
logger.addHandler(handler)

关键操作审计日志

对于重要操作（如任务启动、配置更改、数据删除），记录专门的审计日志，这些日志应包含：操作者、时间、操作对象、操作类型、结果状态，并确保其完整性,不可被应用层修改。

OpenClaw 特定优化建议

按模块/功能分割日志：
- openclaw_crawler.log：网页抓取、反爬处理、请求延迟。
- openclaw_parser.log：数据解析、清洗规则命中情况。
- openclaw_storage.log：数据库写入、文件存储、去重操作。
- openclaw_scheduler.log：任务调度、队列状态、优先级变更。

记录性能指标：在关键函数中使用 DEBUG 级别记录耗时。

@log_execution_time  # 自定义装饰器
def process_item(item):
    pass

错误日志丰富化：捕获异常时，记录尽可能多的上下文（URL、参数、数据片段等），但注意脱敏，避免记录密码、密钥等敏感信息。

try:
    # ... some operation
except Exception as e:
    logger.error(f"Failed to process item: {item_id}",
                 exc_info=True,
                 extra={'url': url, 'item_id': item_id, 'error_type': e.__class__.__name__})