网易首页 > 网易号 > 正文 申请入驻

1张4090,本地部署多模态大模型

0
分享至


大家好,我是 Ai 学习的老章

我对阿里通义千问十分喜爱,单说私有化部署,成本比 DeepSeek 低很多倍。私有化部署 DeepSeek- V3 或 R1,纯硬件成本保底 150 万(英伟达 H20 141GB 版),如果是国产算力,保底 200 万了。但阿里的推理模型 QwQ:32B,只需要 4 张 4090 就行了(成本 10 几个 w),表现非常优异,很多场景可以替代 DeepSeek。具体参看 [[2025-03-22-大模型推理引擎vllm,启动QwQ-32B]] 而多模态大模型 Qwen2.5-VL-32B 也只需要 4 张卡,7B 只需要 1 张!

Qwen2.5-VL 简介

Qwen2.5-VL 是阿里通义千问团队开源的旗舰视觉语言模型,有 3B、7B、32B、72B 等不同规模。该模型在视觉理解方面表现出色,能够识别常见物体,分析图像中的文本、图表等元素。

Qwen2.5-VL 具备作为视觉 Agent 的能力,可以推理并动态使用工具,初步操作电脑和手机。在视频处理上,Qwen2.5-VL 能够理解超过 1 小时的长视频,精准定位相关片段捕捉事件。模型还支持发票、表单等数据的结构化输出。

Qwen2.5-VL 在多个性能测试中表现优异,在文档和图表理解方面优势明显,7B 模型在多项任务中超越了 GPT-4o-mini。模型的推出为开发者提供了强大的工具,能够在多种应用场景中发挥重要作用。

本文我们主要介绍 Qwen2.5-VL-7B 本地化部署

下载模型

从 modelscope 下载,毕竟 huggingface 网不通。

模型文件:https://modelscope.cn/models/Qwen/Qwen2.5-VL-7B-Instruct/files

安装 modelscope:pip install modelscope

下载完整模型库:modelscope download --model Qwen/Qwen2.5-VL-7B-Instruct --local_dir /home/data-local/qwen25VL

将模型下载到指定的本地目录 "/home/data-local/qwen25VL" 中。

一共 16 个 GB

推理引擎选择 vLLM

安装 vllm:pip install vllm

运行大模型:

CUDA_VISIBLE_DEVICES=4  vllm serve /ModelPath/Qwen2.5-VL-7B-Instruct --port 8000  --host 0.0.0.0 --dtype bfloat16  --limit-mm-per-prompt image=5,video=5 --max-model-len 16384

我的机器前 4 张卡被占用了,所以我是用第五张卡来启动 Qwen2.5-VL-7B,指定 CUDA_VISIBLE_DEVICES=4(第一张卡编号是 0)

使用

直接上 openweb-ui

安装:pip install open-webui

运行:open-webui serve

浏览器打开 http://locahost:8080

如果是服务器部署,把 localhost 改为服务器 ip

正常注册登陆


右上角点击头像,点击管理员面板

点击设置 - 外部链接,照着抄一下,api key 随便填写


然后回到前端,左上角添加模型那里就可以找到 Qwen2.5-VL-7B-Instruct 了


上传图片,随便问个问题,回答很精准


再来一张


它的回复是: 这一张图片是一张带有文字的图,描绘了两个人的脸部,一个表情平静,另一个表情有些惊讶或困惑。图片下的文字写着:"产品说,做一个需求:手机摇一摇,让周围人的支付宝余额都转我卡里!" 这句话的字面含义是指开发人员提出一个荒谬的需求,即通过摇手机来实现将附近人的支付宝余额转移到他们的卡里。这种需求显然是不现实和技术上不可行的。这幅图可能用于表达对不台理或无法实现的技术需求的讽刺或幽默。

卡不够的同学,真的可以试试这个 7B 版本。开源做到这个程度,属实无可挑剔了。

88

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

刚刚,阿里又开源了,超长上下文大模型

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
人民币遭遇最强升值压力!快要憋不住了

人民币遭遇最强升值压力!快要憋不住了

睿知睿见
2025-05-28 07:36:55
吴艳妮100米栏预赛13秒07小组第二 田中佑美12秒89断崖式领先

吴艳妮100米栏预赛13秒07小组第二 田中佑美12秒89断崖式领先

劲爆体坛
2025-05-28 10:21:07
妻子性欲强丈夫无能,竟帮找炮友亲自去开房,还同意一个月睡3次

妻子性欲强丈夫无能,竟帮找炮友亲自去开房,还同意一个月睡3次

情感艺术家
2025-05-04 18:20:39
直到12岁儿子和我拳脚相向,我才醒悟:戒掉手机最好的方式,不是打骂,不是纵容,而是......

直到12岁儿子和我拳脚相向,我才醒悟:戒掉手机最好的方式,不是打骂,不是纵容,而是......

阅读第一
2025-05-24 08:33:36
西媒:日本球星久保建英被皇家社会挂牌出售

西媒:日本球星久保建英被皇家社会挂牌出售

星耀国际足坛
2025-05-27 23:45:13
MVP前十年大腿数量排行榜:库里第三!比詹姆斯加乔丹还多!

MVP前十年大腿数量排行榜:库里第三!比詹姆斯加乔丹还多!

历史第一人梅西
2025-05-28 11:02:20
快船内部矛盾加剧!哈登背叛到底伤了谁的心?

快船内部矛盾加剧!哈登背叛到底伤了谁的心?

不吃草的羊羔
2025-05-28 12:45:15
4年6800万?湖人赶紧签吧,这价格不亏

4年6800万?湖人赶紧签吧,这价格不亏

八零后小伙儿
2025-05-28 11:12:42
毛遂自荐?“魔兽”霍华德晒自己穿尼克斯球衣PS照:

毛遂自荐?“魔兽”霍华德晒自己穿尼克斯球衣PS照:

直播吧
2025-05-28 11:53:13
“三箱茅台酒都是假的?!”知名电商平台花费数万元,上海消费者直呼“很受伤”→

“三箱茅台酒都是假的?!”知名电商平台花费数万元,上海消费者直呼“很受伤”→

新民晚报
2025-05-27 20:31:45
最简单增肌练法,吊打现代技术100年

最简单增肌练法,吊打现代技术100年

FitEmpire健身领域
2025-05-28 11:14:25
北京摇号多年不中?是继续死磕燃油车,还是转战新能源?

北京摇号多年不中?是继续死磕燃油车,还是转战新能源?

80后北京大叔
2025-05-28 10:42:27
这家银行,不良率突破30%

这家银行,不良率突破30%

读懂数字财经
2025-05-28 11:59:03
欧盟第18次制裁俄罗斯,将石油从每桶60美元降至45美元

欧盟第18次制裁俄罗斯,将石油从每桶60美元降至45美元

清滨酒客
2025-05-27 19:42:41
女性会忘记和自己发生过关系的男性吗?

女性会忘记和自己发生过关系的男性吗?

素然追光
2025-05-22 03:05:03
为何房子前面不种桂花树?是会伤地基,还是香气会害人?

为何房子前面不种桂花树?是会伤地基,还是香气会害人?

Hi秒懂科普
2025-05-28 06:16:13
最高降5.3万元,比亚迪掀起新一轮价格战,高盛自称卖方,中金称已有一定预期

最高降5.3万元,比亚迪掀起新一轮价格战,高盛自称卖方,中金称已有一定预期

华尔街见闻官方
2025-05-28 03:09:35
朱炯:在贵阳生活和在上海没什么大区别,非常习惯吃折耳根

朱炯:在贵阳生活和在上海没什么大区别,非常习惯吃折耳根

懂球帝
2025-05-27 21:24:13
九华山美女道士,靠身体施法“日进斗金”,8个男徒弟曝光内幕

九华山美女道士,靠身体施法“日进斗金”,8个男徒弟曝光内幕

苏大强专栏
2025-05-08 15:16:18
顾客自称遇到567元一公斤的“青菜刺客”,超市品牌方回应

顾客自称遇到567元一公斤的“青菜刺客”,超市品牌方回应

大象新闻
2025-05-27 16:34:07
2025-05-28 14:15:00
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
2975文章数 11011关注度
往期回顾 全部

科技要闻

星舰第9飞:飞船太空"翻跟斗",卫星没放成

头条要闻

印度代表带150页文件宣讲胜利 日本外相只听了15分钟

体育要闻

癌症打不垮的硬汉,再登欧冠决赛舞台

娱乐要闻

刘若英为演唱会点歌环节两姐妹致歉

财经要闻

"得物搬砖"暴利骗局:大学生成"接盘侠"

汽车要闻

新款smart精灵#1官图发布 将于5月31日上市

态度原创

手机
艺术
家居
房产
亲子

手机要闻

真我Neo7 Turbo值得入手吗?看完最全配置,你就有答案了!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

开阔实用 技术控的大平层

房产要闻

突发,大量宅地挂出;海口旧改又有千亿巨头进场!

亲子要闻

中国家长"卷"出600亿新市场