情报串流 (0)
📝 本期排版草稿
在信息流中点击"+ 入稿"添加文章
📄 结构化解析详情
🎯 大模型飞轮纠偏与配置中心
评分调优记录
0
分类纠正记录
0
Prompt结果纠正
0
已分析入库
0
近期评分调优记录
| 时间 | 文章 | 原评分 | 新评分 | 调整原因 |
|---|
近期分类纠正记录
| 时间 | 文章 | AI 原判 | 纠正为 | 纠正理由 | |||
|---|---|---|---|---|---|---|---|
| 暂无纠正记录 | |||||||
近期 Prompt 结果纠正 (P0/P1 阶段判断错误,用于优化过滤 Prompt)
| 时间 | 文章 | 阶段 | 错误类型 | 纠正理由 | ||
|---|---|---|---|---|---|---|
| 暂无纠正记录 | ||||||
在信息流中点击"+ 入稿"添加文章
📡 采集控制台
📊 各信息源入库状态
🕷️ 信息源爬取
🤖 AI 分析入库
🔗 新闻去重聚合
以爬虫入库时间(crawled_at)为基准,对同一领域标签内近期文章按 P3 战略情报摘要进行同事件聚类,多篇报道折叠展示、主文章置顶。
注:内容去重(URL/标题/SimHash/向量相似度)在文章入库时已自动执行,无需手动触发。
适合日常定时补充:新文章自动并入已有聚类,或与其他新文章形成新聚类。
适合算法更新后重建聚类,或手动排查问题后强制刷新。会覆盖已有结果。
📁 板块分布
🎯 评分分布
🔀 流水线漏斗
🎡 飞轮积累
📋 流水线逐条明细
修改平台关注的三大领域词条,注入到 P1/P2/P3 Prompt 指导 AI 判断。
每行一个词条,格式:词条名称 [A] 或 词条名称 [B](不写默认 B 级)。
保存后下次流水线自动生效(无需重启服务)。
M1-M11 是 强制置顶触发条件,注入 P2/P3 Prompt。
命中任一条件 → is_mandatory_pick = true →
P3 战略增量自动给 ≥15 分,P4 强制排至分组第 1 名。
修改后下次流水线自动生效。
D1-D12 是板块②③共用的二级标签定义,注入 P2/P3 Prompt。 典型方向直接影响 P3 对文章战略关联程度的判断, 从而影响 30 分战略增量价值。 每行一个方向,保存后下次流水线自动生效。
修改各板块评分维度的分值,下次 AI 流水线自动生效。 注意:枚举值文本必须与 P2 Prompt 中的选项完全一致,否则查表得 0 分。
⚙️ 系统全局设置
DeepSeek API 配置
当前模型: deepseek-v4-flash
接入地址: api.deepseek.com
📡 爬取和 AI 分析流水线已移至 「采集控制台」 面板,点击左侧导航栏进入。
📋 更新日志
- 「重置并分析」功能重构:后端新增 /api/pipeline/run-ids 端点,reset 返回被重置文章的精确 ID 列表,pipeline 仅对这批 ID 运行,完全不触碰其他待分析文章,两行操作区彻底独立
- 修复关注领域编辑器显示 [object Object] 的问题:v2.0 将词条改为 {name, tier} 对象后前端未适配;现在显示格式为「算电协同 [A]」,支持直接编辑 Tier 等级,保存时自动解析还原
- 前端飞轮调参维度适配 v2.0:重大部署板块将"信源质量(max 6)"更正为"政策具体性(max 8)",主体级别 max 50→38,主题相关度 max 20→30
- 文章详情面板新增"政策具体性"字段展示(仅重大部署板块);突破性描述改用全板块填写的 breakthroughDesc,Board 1/3 不再显示"-"
- AI分析入库区域拆分为独立两行,所有控件固定宽度加 flex-shrink:0,消除不同浏览器下随机折行问题
- P2 重大部署板块:主体级别压缩分差(L1 50→38,L3两会 15→28),内容相关度扩大权重(直接核心 20→30),source_quality 替换为 policy_specificity(政策具体性),外交套话/仪式性内容被强制降为最低档
- P2 全球前沿技术扫描:grid_cross 细化为4档,算力AI/量子/储能等战略优先方向(+35/+28)与海上风电等常规能源技术(+16)拉开差距
- P2 战新产业动态:grid_relevance 细化为4档,新增"战略重点关联"档(量子应用/氢能/核能,+20),海上风电并网降至常规关联(+13)
- strategy_config core_domains 每条方向标注 Tier A/B:P3 Tier A 强命中 +5,Tier B 强命中 +2,分差从1分扩大到3分
- P3 M1-M7 加分提升(M1/M2/M7 +6,M3-M6 +4),同时精化触发边界,外交套话不触发,M4 限定为 Tier A 科技突破方向
- P3 新增地方内容修正:省市级推广性举措得分 ×0.7
- P2 分类新增全板块描述字段 grid_relevance_desc / breakthrough_desc,所有板块均填写电网关联和突破描述,不再显示"-"
- 系统设置新增评分逻辑说明板块,完整展示打分机制供编辑参考
- 侧边栏筛选树三个一级板块默认全部展开,点击板块标题筛选该板块文章不再折叠列表
- 点击「智能信息串流」按钮重置所有筛选条件,回到全量显示
- 重置分析状态新增板块选择和发布时间区间筛选,支持与范围类型任意组合使用
- 流水线明细分页控件移至筛选栏右侧,新增页码输入框可直接跳转至指定页
- 飞轮评分历史改为从数据库读取,容器重建后记录不再丢失
- score_feedback 表新增 old_score / new_score 字段,新记录完整保存调整前后分数
- 飞轮纠偏视图新增 Excel 导出功能:评分调优记录和分类纠正记录均支持勾选单条/全选后导出为 .xlsx
- 新增通用正文清洗器,统一修复多类站点的导航、评论区、表单、脚本/CSS 噪音混入问题
- 修复财联社、央视网、中国能源新闻网、FrostChina、Nature、中国科技网等来源的正文识别与发布时间抽取
- 收紧部分详情链接识别规则,减少栏目页、错误链接或占位页被误入库
- 为经济日报 RSS、Nature / 美国能源部 RSS 补充详情页回流逻辑,避免仅入库摘要或“阅读全文”占位内容
- 补充爬虫离线单测、在线样例校验脚本,并生成 live 抽样报告供人工复核
- 智能串流去掉200条上限,过滤 primaryTab 为空的文章,板块/标签计数完全对齐
- 修复一级板块点击展开/收起逻辑,二级标签计数改为 board+tag 双重过滤
- 流水线明细默认显示今天、无条数限制、每页50条分页、标记字段缺失文章
- 采集控制台汇总数字每30秒自动刷新,流水线运行中每15秒同步刷新
- 所有系统时间(爬取/分析/调度/完成时间)统一转北京时间显示
- api_error 重置范围兼容历史旧格式记录
- P2失败时写入标记,前端正确显示 ⚠️
- 流水线超时从 6h 延长至 7h
- 新增
system_settings表,持久化 last_auto_run / last_manual_run,容器重启后不丢失触发时间 - 自动触发未指定日期时默认仅扫描近 8 天数据,手动触发保持不限制时间范围
- 服务器补建 pipeline_feedback 表,本地与服务器数据库结构完全对齐
- 修复「各信息源入库状态」待分析计数错误(LEFT JOIN 空行被误计为 1)
- 同步 sources 表至 159 条,修复前端信息源显示错位问题
- 采集源数量从硬编码改为动态读取,与数据库实际条数保持一致
- AI 流水线最大运行时间从 2 小时延长至 6 小时
- 修复 P0/P1 API 调用失败时被误判为「拦截❌」的问题:失败时抛出异常而非返回拦截结果,确保在对应阶段正确显示 ⚠️
- P0/P1/P2/P3 四个阶段均新增 503(服务过载)自动重试,等待 60s 后最多重试 2 次,减少偶发性过载导致的失败
- 重置选项「API调用失败」兼容旧格式(P0-LLM失败拦截),历史错误文章也可一键重置
- 流水线日志各阶段图标(P0/P1/P2)悬停显示详细原因
- P0/P1 API 调用失败时写入错误标记并在日志中显示 ⚠️,不再默认放行或静默跳过
- 新增筛选按钮「⚠️ API失败」,一键查看所有调用失败的文章
- 重置分析状态新增选项「⚠️ API调用失败的文章(任意阶段)」,覆盖 P0/P1/P2 三个阶段
- 各信息源入库状态改为 LEFT JOIN,已配置但暂无文章的来源也会显示(条数为 0)