fix:优化爬虫链路

This commit is contained in:
Daniel
2026-03-05 19:18:45 +08:00
parent 475097d372
commit 004b03b374
6 changed files with 15 additions and 4 deletions

View File

@@ -26,7 +26,12 @@ def _call_ollama_extract(text: str, timeout: int = 15) -> Optional[Dict[str, Any
try:
import requests
raw = str(text).strip()[:EXTRACT_TEXT_MAX_LEN]
prompt = f"""从以下美伊/中东新闻**全文或摘要**中,提取**报道明确给出的数字与事实**,输出 JSON。规则:
prompt = f"""从以下美伊/中东新闻**全文或摘要**中,提取**报道明确给出的数字与事实**,输出 JSON。
输入说明:
- 原文可能是英文、中文或其他语言English / Chinese / Arabic / Persian 等),请先理解含义,再按要求输出。
规则:
1. 仅填写报道中**直接出现、可核对**的数据,不要推测或估算。
2. 无明确依据的字段**必须省略**,不要填 0 或猜。
3. **战损一律按增量**:只填本则报道中「本次/此次/今日/本轮」**新增**的伤亡或损毁数量。若报道只给「累计总数」「迄今共」「total so far」等**不要填写**该字段(避免与库内已有累计值重复叠加)。
@@ -50,7 +55,7 @@ def _call_ollama_extract(text: str, timeout: int = 15) -> Optional[Dict[str, Any
原文:
{raw}
直接输出 JSON不要解释"""
直接输出 JSON 对象,不要解释,不要加反引号或代码块标记"""
r = requests.post(
"http://localhost:11434/api/chat",
json={