DeepSeekOCR有网页端了DeepSeekOCR如何本地部署有人搞出Dee

量子位看科技 2025-10-22 17:39:51

DeepSeekOCR有网页端了DeepSeekOCR如何本地部署

有人搞出DeepSeek-OCR()网页端了,想本地部署的小伙伴可以试下。

目前支持4种模式:

- 【图1】普通OCR模式(Plain OCR):识别图表中的年份与对应数值,表格类图片也能提取成结构化文本。

- 【图2】描述模式(Describe):自动生成图像自然语言描述,包括骑手服饰、图案配色、车身赞助品牌等,细节丰富。

- 【图3】查找模式(Find):输入关键词“helmet”,模型精准标记出赛车手头盔位置,支持多目标高亮,适合结构化信息提取。

- 自由模式:自定义提示词,处理更复杂任务。

网页版地址自己跑完后就是localhost:3000,界面清爽。

UI也挺现代,有拖拽上传、可视化标注框、结果复制下载等小功能。每次上传限制100MB,够用了。

项目前端是React写的,后端用FastAPI,支持Docker一键部署,适配N卡,配好环境就能直接跑。

注意:镜像里不包含模型,首次运行会自动下载(大概5-10GB),网络快的就随它去下。

从部署文档看,这项目适配了3090到5090一堆显卡,作者还踩了RTX 5090驱动坑,亲测出坑方案也写上了,整套环境折腾好就稳了。

感兴趣的可以直接看GitHub:github.com/rdumasia303/deepseek_ocr_app

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注