Cyrene

AskaEth/Cyrene

Fork 0

Commit Graph

Author	SHA1	Message	Date
AskaEth	189f7b999b	feat: VisionTool 集成多模态 LLM 直接调用 — OCR/视觉分析 - VisionTool 改为接受可选 llm.LLMProvider，有模型时直接调用视觉模型分析，无模型时回退 base64 data URL 模式，不影响基本功能 - ModelSelector 新增 PurposeVision 路由用途 - main.go 按 vision routing 自动发现并注入视觉模型 provider - 支持 models.json 中 qwen3.6-flash / qwen-vl-ocr-latest fallback 链 Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>	2026-05-24 16:25:56 +08:00
AskaEth	9a8fb8d0ce	feat: Phase 6.3 视觉理解 — 多模态图片输入 + OCR/Vision 工具 + 图片编码管线 - LLMMessage 新增 Images 字段支持多模态 content array - OpenAIProvider 支持 image_url content parts - VisionTool: 图片读取 + base64 编码 + OCR/场景描述/综合分析 - 对话管道全线支持 images 参数传递 (Gateway->Orchestrator->Synthesizer->LLM) - 自动根据图片有无构建 text-only 或 multimodal content Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>	2026-05-23 22:28:42 +08:00

Author

SHA1

Message

Date

AskaEth

189f7b999b

feat: VisionTool 集成多模态 LLM 直接调用 — OCR/视觉分析

- VisionTool 改为接受可选 llm.LLMProvider，有模型时直接调用视觉模型分析，
  无模型时回退 base64 data URL 模式，不影响基本功能
- ModelSelector 新增 PurposeVision 路由用途
- main.go 按 vision routing 自动发现并注入视觉模型 provider
- 支持 models.json 中 qwen3.6-flash / qwen-vl-ocr-latest fallback 链

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

2026-05-24 16:25:56 +08:00

AskaEth

9a8fb8d0ce

feat: Phase 6.3 视觉理解 — 多模态图片输入 + OCR/Vision 工具 + 图片编码管线

- LLMMessage 新增 Images 字段支持多模态 content array
- OpenAIProvider 支持 image_url content parts
- VisionTool: 图片读取 + base64 编码 + OCR/场景描述/综合分析
- 对话管道全线支持 images 参数传递 (Gateway->Orchestrator->Synthesizer->LLM)
- 自动根据图片有无构建 text-only 或 multimodal content

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

2026-05-23 22:28:42 +08:00

2 Commits