RSS‑AI

一个 RSS 助手：定时抓取多个 RSS 源，使用用户自定义的 AI（OpenAI 通用格式）对最新文章进行总结并排版，去重入库，推送到 Telegram 群组，同时提供标准 API 与前端 Web 管理界面。默认监听端口 3601。

– 后端：Python + FastAPI（含 OpenAPI/Swagger、详细日志、可热更新配置、后台定时任务） – 前端：黑白配色、简约高级的 Web 页面（查看摘要与在线修改配置）

图片（最早期版本）

WEB

Desktop Screenshot 2025 10 06 - 11 07 55 93

功能概览

定时抓取：从配置文件读取多个 RSS 源，按间隔抓取最新文章。
AI 总结：支持先抓取原文网页并抽取正文，再送入用户配置的 OpenAI 兼容接口，输出 JSON，字段包含：
- title 标题
- link 原始网页 URL
- pubDate 发布时间
- author 作者
- summary_text AI 中文总结
文章搜索：前端支持按标题、AI 摘要以及抓取到的原文内容全文检索，可在列表顶部快速查找历史文章，并提供一键清空。
原文预览：文章详情弹窗新增“原文内容”区块，可直接查看抓取的正文文本，方便核对摘要是否准确。
关键词过滤与标注：支持在配置中维护关键词列表，仅保留命中关键词的文章；命中的关键词会同步展示在 Web 列表、弹窗与 Telegram 推送，方便快速定位关注点（英文匹配区分大小写）。
去重与存储：使用 SQLite 本地存储，基于 feed_url + item_uid 唯一约束去重；可配置最大存储条数，自动裁剪旧数据。
单源抓取上限：可为每个 RSS 源设置“单次抓取最多处理 N 条”，按时间倒序优先（越新越先处理）。
Telegram 推送：将 AI 总结以精简排版推送到指定群组或频道，支持单独控制文章推送与抓取汇总推送。
抓取汇总推送（可选）：可将每次抓取的汇总信息（条目总数、入库成功/重复/失败、AI 调用成功/失败次数、Token 消耗等）推送到 Telegram，可在设置页一键关闭。
标准 API：提供 RESTful 接口与 /docs Swagger UI。
前端管理：查看摘要列表、手动抓取、在线修改配置（无需重启服务）。
- 可自定义提示词：支持自定义 System Prompt 与 User Prompt 模板（可用 {title}、{link}、{pub_date}、{author}、{content} 占位符）。
- 支持设置 AI 调用超时，按需延长或收紧每次请求的最大等待时间。
- Telegram 设置页新增“抓取完成后推送统计汇总”开关，可按需关闭尾部汇总消息。
安全校验：保存设置需输入 4 位数字管理密码（默认 1234，可在设置页通过旧密码更新）。

目录结构

backend/ 后端源码与依赖
- app/ FastAPI 应用、调度器、AI/Telegram/报告客户端、正文抽取、存储等模块（如 main.py、scheduler.py、ai_client.py、report_service.py 等）
- config.yaml 运行时配置（仓库已提供一份可直接修改的默认配置）
- data/ SQLite 数据库存放目录
- logs/ 运行日志输出目录
- requirements.txt 后端依赖
- run.sh 本地启动脚本
- Dockerfile 后端容器镜像构建文件
frontend/ 前端静态页面与轻量服务（原生 HTML/CSS/JS + Python 反代脚本）
- index.html、app.js、styles.css Web 界面资源
- server.py 简易静态文件 + 反向代理服务
- run.sh 本地启动脚本（默认 3602 端口）
- Dockerfile 前端容器镜像构建文件
docker-compose.yml 一键启动前后端组合服务

快速开始

安全事项

在公网部署时请注意不要公开后端端口3601，（/api/config 会原样返回 API Key，且 CORS 允许任意来源代码在启动时将 CORS allow_origins=["*"]；同时 GET /api/config 直接回传完整配置（含 openai.api_key）。这意味着只要能访问到你的后端，任意站点都能读取到密钥（浏览器 CORS 放行））

准备环境

Python 3.10+
可选：创建虚拟环境 python -m venv .venv && source .venv/bin/activate

git clone https://github.com/zhuchenyu2008/RSS-AI
cd RSS-AI

安装依赖并启动后端（端口 3601）

cd backend
pip install -r requirements.txt
./run.sh

后端启动后监听 http://127.0.0.1:3601，Swagger UI 在 http://127.0.0.1:3601/docs。

启动前端服务（端口 3602，同源访问 + 反向代理 /api）

cd frontend
PORT=3602 BACKEND_BASE_URL=http://127.0.0.1:3601 ./run.sh

打开浏览器访问 http://127.0.0.1:3602。该前端服务会将 /api/* 请求反向代理到后端 3601，实现同源访问，无需 CORS。

首次使用请在“设置”页使用默认密码 1234 保存或修改配置，并根据需要及时更换新密码。

使用 Docker 运行（推荐）

方法一：使用 Docker Hub 预构建镜像

已在 Docker Hub 发布官方镜像，可直接拉取并运行：

docker pull zhuchenyu2008/rss-ai-backend
docker pull zhuchenyu2008/rss-ai-frontend

若仅使用后端，可通过以下命令启动（默认监听 3601 端口）：

docker run -d \
  --name rss-ai-backend \
  -p 3601:3601 \
  -v "$(pwd)/backend/config.yaml:/app/config.yaml" \
  -v "$(pwd)/backend/data:/app/data" \
  -v "$(pwd)/backend/logs:/app/logs" \
  zhuchenyu2008/rss-ai-backend

前端镜像为纯静态资源服务，需要指定后端地址并映射 3602 端口：

docker run -d \
  --name rss-ai-frontend \
  -p 3602:3602 \
  -e BACKEND_BASE_URL="http://127.0.0.1:3601" \
  zhuchenyu2008/rss-ai-frontend

两者配合使用时，请保证前端容器能够访问后端地址（可在同一主机使用默认端口，或结合反向代理/自定义网络）。

方法二：自行构建

确保已安装 Docker 与 Docker Compose：

docker compose build
docker compose up -d

启动完成后：

后端 API：http://127.0.0.1:3601 （Swagger: /docs）
前端 Web：http://127.0.0.1:3602 （同源反代到后端）

数据与配置持久化：

backend/config.yaml 会被挂载到容器 /app/config.yaml，可本地编辑后热更新（保存配置也会写回本地文件）。
backend/logs/ 与 backend/data/ 挂载为持久化目录（日志与 SQLite 数据库）。

常用命令：

# 查看日志
docker compose logs -f backend
docker compose logs -f frontend

# 重建镜像
docker compose build --no-cache

# 停止并移除容器
docker compose down

配置说明（backend/config.yaml）

仓库内已提供 backend/config.yaml，可直接修改（前端“设置”页保存也会写回此文件）。关键字段：

server:
  host: 0.0.0.0
  port: 3601

fetch:
  interval_minutes: 10   # 抓取间隔（分钟）
  max_items: 500         # 存储上限（总条数）
  feeds:                 # RSS 列表
    - https://hnrss.org/frontpage
  filter_keywords:       # 关键词列表，命中后才会入库/推送，可留空；英文匹配区分大小写
    - 人工智能
    - Generative AI
  use_article_page: true # 抓取原文网页并抽取正文后再送AI
  article_timeout_seconds: 15
  per_feed_limit: 20     # 单个RSS源每次抓取的最大条数（按时间倒序优先）

ai:                      # OpenAI 通用格式
  enabled: true
  base_url: https://api.openai.com/v1   # 可填 https://api.openai.com 或 https://api.openai.com/v1，二者均兼容
  api_key: YOUR_API_KEY
  model: gpt-4o-mini
  temperature: 0.2
  timeout_seconds: 30     # 单次AI请求超时（秒），范围 5-300，可根据模型响应速度调整
  system_prompt: |
    你是一个中文内容编辑助手。请对RSS文章进行信息抽取与高质量中文摘要，并输出严格的JSON对象，字段必须为：title, link, pubDate, author, summary_text。其中：title为原文标题或优化后的标题；link为原始URL；pubDate为发布时间（原文给出即可）；author为作者（若未知可留空字符串）；summary_text为简洁、条理清晰的段落式中文总结。务必只输出JSON，不要任何解释或markdown。
  user_prompt_template: |
    标题: {title}
    链接: {link}
    发布时间: {pub_date}
    作者: {author}
    正文/摘要(可能包含HTML):
    {content}

    请只输出JSON，不要任何解释或markdown。

telegram:
  enabled: false
  bot_token: YOUR_TELEGRAM_BOT_TOKEN
  chat_id: "@your_channel_or_chat_id"
  push_mode: all        # 推送内容：all=全部推送、article_only=只推送文章、report_only=只推送定时汇总
  push_summary: true    # 抓取完成后是否推送统计汇总消息

reports:
  daily_enabled: true             # 是否生成每日汇总报告
  hourly_enabled: true            # 是否生成每小时汇总报告
  report_timeout_seconds: 60      # 生成报告时的 AI 请求超时时间（秒）
  system_prompt: "..."            # 报告生成的系统提示词，可按需调整
  user_prompt_template: "..."     # 报告生成的用户提示词模板，可使用 {label}/{timeframe}/{article_count} 等占位符

security:
  admin_password: "1234"   # 前端保存设置所需的 4 位数字密码，可在界面上输入旧密码后更新

logging:
  level: INFO
  file: logs/app.log

AI 接口为 OpenAI 兼容格式（/v1/chat/completions），你可替换 base_url 与 model 指向任意兼容服务。
前端“设置”页支持在线更新以上配置。为安全起见，api_key 与 bot_token 在界面不回显；若不修改请留空，后端会保留旧值。
telegram.push_mode 控制推送范围：all 为发送文章和定时汇总，article_only 仅推送文章，report_only 仅推送定时汇总。
telegram.push_summary 控制抓取流程结束后是否推送统计汇总消息。
报告任务可通过 reports 模块配置是否启用每日/每小时汇总，并自定义提示词模板；生成的报告同样会写入数据库与日志，便于二次处理或对接其他通知渠道。
自定义提示词：
- System Prompt 与 User Prompt 模板均可在前端“AI 设置”中修改并保存。
- 若模板中需要字面量大括号，请使用双大括号进行转义，例如 {{ 与 }}。

正文抽取说明

抽取逻辑基于启发式：优先选择 <article>、<main>、#content、.content 等容器，按段落数量与文本长度评分；会自动忽略 script/style/nav/footer/aside 等无关元素。
若抽取失败，会回退使用 RSS 内置的 content/summary。
可通过 fetch.use_article_page 开关控制是否启用该能力；超时由 fetch.article_timeout_seconds 控制。
每次抓取会先按时间倒序对条目排序，再截取 fetch.per_feed_limit 条进行处理，避免一次处理过多历史项。

API 速览

GET /api/health 健康检查
GET /api/settings 获取配置（敏感信息打码）
PUT /api/settings 更新配置（支持热更新抓取间隔）
POST /api/fetch 立即抓取（可选 {"force": false}）
GET /api/articles?limit=20&offset=0&feed= 列表查询
GET /api/articles/{id} 文章详情

完整接口文档请见 :3601/docs（Swagger UI）。

前端界面与操作

内容页工具栏
- 自动刷新：每约 1 分钟自动刷新文章列表（调用 GET /api/articles）。仅更新前端显示，不会触发抓取、AI 调用或 Telegram 推送。
- 强制抓取：勾选后点击“手动抓取”，向 POST /api/fetch 发送 {"force": true}。这会跳过前置去重检查，对候选条目执行“原文抽取 + AI 总结”。数据库仍有唯一约束，已存在的文章不会重复入库或再次推送；该操作会消耗 AI 调用，建议仅在联调/验证时使用。
设置页（要点）
- 单源抓取上限：限制每次抓取时单个 RSS 源最多处理条数，按时间倒序优先（越新越先处理）。
- 使用原文抽取正文 + 超时：先抓取原文网页并抽取正文，再交给 AI，总结质量更高；抽取失败则回退 RSS 摘要。
- AI 提示词：内置默认 System Prompt 与 User Prompt 模板（已预填）；你可以直接微调而无需从零编写。

运行日志

统一输出到控制台与 backend/logs/app.log，日志包含抓取、去重、AI 调用与 Telegram 推送结果等信息，便于追踪问题。

去重与存储策略

基于 (feed_url, item_uid) 唯一约束进行去重。item_uid 优先使用 RSS 的 id/guid 字段；若缺失，则使用 sha1(link|title) 作为唯一标识。
存储超过 max_items 时自动删除最旧记录。

注意事项

首次运行前请在配置中填入有效的 AI api_key 与 base_url/model，以及 Telegram bot_token 与 chat_id（可选）。
网络环境受限时（例如公司内网），前端可本地打开使用；后端需要能访问 RSS、AI 接口与 Telegram。
本项目以稳定、可维护为目标，尽量减少外部依赖（存储使用 SQLite，调度器为内置线程）。

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
backend		backend
frontend		frontend
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RSS‑AI

图片（最早期版本）

功能概览

目录结构

快速开始

使用 Docker 运行（推荐）

方法一：使用 Docker Hub 预构建镜像

方法二：自行构建

配置说明（backend/config.yaml）

正文抽取说明

API 速览

前端界面与操作

运行日志

去重与存储策略

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

RSS‑AI

图片（最早期版本）

功能概览

目录结构

快速开始

使用 Docker 运行（推荐）

方法一：使用 Docker Hub 预构建镜像

方法二：自行构建

配置说明（backend/config.yaml）

正文抽取说明

API 速览

前端界面与操作

运行日志

去重与存储策略

注意事项

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages