← 返回
数据分析 Key

GLM Multimodal Analyzer

使用GLM-4.6V模型进行多模态内容理解(图片、视频、文档)
使用GLM-4.6V模型进行多模态内容理解(图片、视频、文档)
tridefender
数据分析 clawhub v1.0.0 1 版本 99907.3 Key: 需要
★ 0
Stars
📥 1,078
下载
💾 144
安装
1
版本
#latest

概述

Multimodal Understanding Skill

使用智谱GLM-4.6V模型理解图片、视频、文档内容。

功能

  • 图片理解:OCR、场景分析、物体检测、属性识别
  • 视频理解:内容摘要、关键帧分析
  • 文档理解:PDF、复杂表格解析
  • 深度思考模式:开启后进行深层推理分析

使用方式

理解这张图片:[图片URL或本地路径]
分析这个视频:[视频URL]
这个PDF讲什么:[PDF URL]

技术细节

  • 模型:GLM-4.6V (106B, 128K上下文)
  • API端点:https://open.bigmodel.cn/api/paas/v4/chat/completions
  • 需要ZHIPU_API_KEY环境变量

限制

  • 不支持同时处理图片+视频+文件(只能选一种模态)
  • 视频URL需要公网可访问

调用脚本

调用 scripts/analyze.py 进行分析:

python scripts/analyze.py --type image|video|file --input <url_or_path> --prompt "你的问题"

参数:

  • --type: 输入类型 (image/video/file)
  • --input: URL或本地文件路径
  • --prompt: 分析提示词
  • --thinking: 启用深度思考模式
  • --stream: 流式输出

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 06:44 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 199 📥 65,290
data-analysis

A股量化 AkShare

mbpz
A股量化数据分析工具,基于AkShare库获取A股行情、财务数据、板块信息等。用于回答关于A股股票查询、行情数据、财务分析、选股等问题。
★ 166 📥 60,297

Playwright Interactive

tridefender
使用 `js_repl` 实现浏览器和 Electron 的持久化交互,快速进行 UI 迭代调试。
★ 0 📥 483