战略科研信息智能处理平台

情报串流 (0)

查看区间: 至

📝 本期排版草稿

草稿箱为空
在信息流中点击"+ 入稿"添加文章

🎯 大模型飞轮纠偏与配置中心

评分调优记录

0

分类纠正记录

0

Prompt结果纠正

0

已分析入库

0

近期评分调优记录

	时间	文章	原评分	新评分	调整原因

近期分类纠正记录

	时间	文章	AI 原判	纠正为	纠正理由
暂无纠正记录

近期 Prompt 结果纠正（P0/P1 阶段判断错误，用于优化过滤 Prompt）

时间	文章	阶段	错误类型	纠正理由
暂无纠正记录

草稿箱为空
在信息流中点击"+ 入稿"添加文章

请先在草稿箱中添加文章（至少 3 篇）

📋

在左侧草稿箱添加文章后，点击「🪄 AI 梳理结构」开始

AI 将按历史周报风格规划板块结构，你可以拖拽调整后再生成正文

📡 采集控制台

📊 各信息源入库状态

发布时间至

🕷️ 信息源爬取

不含历史归档，顺序运行全部采集源

历史归档截止日期仅采集截止日期之前的历史内容

🤖 AI 分析入库

处理上限篇 (0=全部) 限定发布时间至

重置范围至

🔗 新闻去重聚合

以爬虫入库时间（crawled_at）为基准，对同一领域标签内近期文章按 P3 战略情报摘要进行同事件聚类，多篇报道折叠展示、主文章置顶。
注：内容去重（URL/标题/SimHash/向量相似度）在文章入库时已自动执行，无需手动触发。

处理最近 7 天内尚未归组的新入库文章，不重置已有聚类结果。
适合日常定时补充：新文章自动并入已有聚类，或与其他新文章形成新聚类。

清空最近 14 天内所有聚类标记后完整重跑，LLM 重新读取 P3 摘要判断。
适合算法更新后重建聚类，或手动排查问题后强制刷新。会覆盖已有结果。

📊 Prompt 调优

📁 板块分布

🎯 评分分布

🔀 流水线漏斗

🎡 飞轮积累

📋 流水线逐条明细

触发日期按 AI 分析触发日期筛选；不填则显示最近 300 条

加载中…

修改平台关注的三大领域词条，注入到 P1/P2/P3 Prompt 指导 AI 判断。 每行一个词条，格式：词条名称 [A] 或 词条名称 [B]（不写默认 B 级）。保存后下次流水线自动生效（无需重启服务）。

① 政策与部署类

② 前沿科技类

③ 产业动态类

⚙️ 系统全局设置

DeepSeek API 配置

当前模型: deepseek-v4-flash

接入地址: api.deepseek.com

📡 爬取和 AI 分析流水线已移至 「采集控制台」 面板，点击左侧导航栏进入。

📋 更新日志

2026-05-01 重置并分析精确化 / 关注领域显示修复 / 前端字段适配

「重置并分析」功能重构：后端新增 /api/pipeline/run-ids 端点，reset 返回被重置文章的精确 ID 列表，pipeline 仅对这批 ID 运行，完全不触碰其他待分析文章，两行操作区彻底独立
修复关注领域编辑器显示 [object Object] 的问题：v2.0 将词条改为 {name, tier} 对象后前端未适配；现在显示格式为「算电协同 [A]」，支持直接编辑 Tier 等级，保存时自动解析还原
前端飞轮调参维度适配 v2.0：重大部署板块将"信源质量（max 6）"更正为"政策具体性（max 8）"，主体级别 max 50→38，主题相关度 max 20→30
文章详情面板新增"政策具体性"字段展示（仅重大部署板块）；突破性描述改用全板块填写的 breakthroughDesc，Board 1/3 不再显示"-"
AI分析入库区域拆分为独立两行，所有控件固定宽度加 flex-shrink:0，消除不同浏览器下随机折行问题

2026-05-01 评分体系 v2.0 重构 — 内容优先原则全面落地

P2 重大部署板块：主体级别压缩分差（L1 50→38，L3两会 15→28），内容相关度扩大权重（直接核心 20→30），source_quality 替换为 policy_specificity（政策具体性），外交套话/仪式性内容被强制降为最低档
P2 全球前沿技术扫描：grid_cross 细化为4档，算力AI/量子/储能等战略优先方向（+35/+28）与海上风电等常规能源技术（+16）拉开差距
P2 战新产业动态：grid_relevance 细化为4档，新增"战略重点关联"档（量子应用/氢能/核能，+20），海上风电并网降至常规关联（+13）
strategy_config core_domains 每条方向标注 Tier A/B：P3 Tier A 强命中 +5，Tier B 强命中 +2，分差从1分扩大到3分
P3 M1-M7 加分提升（M1/M2/M7 +6，M3-M6 +4），同时精化触发边界，外交套话不触发，M4 限定为 Tier A 科技突破方向
P3 新增地方内容修正：省市级推广性举措得分 ×0.7
P2 分类新增全板块描述字段 grid_relevance_desc / breakthrough_desc，所有板块均填写电网关联和突破描述，不再显示"-"
系统设置新增评分逻辑说明板块，完整展示打分机制供编辑参考

2026-04-30 UI交互优化 / 飞轮记录持久化 / 重置筛选增强 / 流水线分页改进 / 飞轮记录导出

侧边栏筛选树三个一级板块默认全部展开，点击板块标题筛选该板块文章不再折叠列表
点击「智能信息串流」按钮重置所有筛选条件，回到全量显示
重置分析状态新增板块选择和发布时间区间筛选，支持与范围类型任意组合使用
流水线明细分页控件移至筛选栏右侧，新增页码输入框可直接跳转至指定页
飞轮评分历史改为从数据库读取，容器重建后记录不再丢失
score_feedback 表新增 old_score / new_score 字段，新记录完整保存调整前后分数
飞轮纠偏视图新增 Excel 导出功能：评分调优记录和分类纠正记录均支持勾选单条/全选后导出为 .xlsx

2026-04-29 多来源爬虫正文清洗修复 / RSS详情回流 / live样例验收补齐

新增通用正文清洗器，统一修复多类站点的导航、评论区、表单、脚本/CSS 噪音混入问题
修复财联社、央视网、中国能源新闻网、FrostChina、Nature、中国科技网等来源的正文识别与发布时间抽取
收紧部分详情链接识别规则，减少栏目页、错误链接或占位页被误入库
为经济日报 RSS、Nature / 美国能源部 RSS 补充详情页回流逻辑，避免仅入库摘要或“阅读全文”占位内容
补充爬虫离线单测、在线样例校验脚本，并生成 live 抽样报告供人工复核

2026-04-24 串流/流水线明细全量显示 / 时区统一北京时间 / 自动刷新 / 7h超时

智能串流去掉200条上限，过滤 primaryTab 为空的文章，板块/标签计数完全对齐
修复一级板块点击展开/收起逻辑，二级标签计数改为 board+tag 双重过滤
流水线明细默认显示今天、无条数限制、每页50条分页、标记字段缺失文章
采集控制台汇总数字每30秒自动刷新，流水线运行中每15秒同步刷新
所有系统时间（爬取/分析/调度/完成时间）统一转北京时间显示
api_error 重置范围兼容历史旧格式记录
P2失败时写入标记，前端正确显示 ⚠️
流水线超时从 6h 延长至 7h
新增 system_settings 表，持久化 last_auto_run / last_manual_run，容器重启后不丢失触发时间
自动触发未指定日期时默认仅扫描近 8 天数据，手动触发保持不限制时间范围

2026-04-23 数据库结构对齐与显示修复 / API失败图标修复

服务器补建 pipeline_feedback 表，本地与服务器数据库结构完全对齐
修复「各信息源入库状态」待分析计数错误（LEFT JOIN 空行被误计为 1）
同步 sources 表至 159 条，修复前端信息源显示错位问题
采集源数量从硬编码改为动态读取，与数据库实际条数保持一致
AI 流水线最大运行时间从 2 小时延长至 6 小时
修复 P0/P1 API 调用失败时被误判为「拦截❌」的问题：失败时抛出异常而非返回拦截结果，确保在对应阶段正确显示 ⚠️
P0/P1/P2/P3 四个阶段均新增 503（服务过载）自动重试，等待 60s 后最多重试 2 次，减少偶发性过载导致的失败
重置选项「API调用失败」兼容旧格式（P0-LLM失败拦截），历史错误文章也可一键重置

2026-04-22 流水线日志增强

流水线日志各阶段图标（P0/P1/P2）悬停显示详细原因
P0/P1 API 调用失败时写入错误标记并在日志中显示 ⚠️，不再默认放行或静默跳过
新增筛选按钮「⚠️ API失败」，一键查看所有调用失败的文章
重置分析状态新增选项「⚠️ API调用失败的文章（任意阶段）」，覆盖 P0/P1/P2 三个阶段
各信息源入库状态改为 LEFT JOIN，已配置但暂无文章的来源也会显示（条数为 0）