![](https://cdn.jiqizhixin.com/assets/code-modal__close-c158a550a9982aa92801c046548d72945aa912de6f2a012513132fdc02dfc379.png)
Auto Byte
专注未来出行及智能汽车科技
![](https://cdn.jiqizhixin.com/assets/auto-byte__qr-code-89b58c6d2398c12b7def0f2538cac5ff08727062918f9bad97f25b1d61aac000.png)
微信扫一扫获取更多资讯
![](https://cdn.jiqizhixin.com/assets/code-modal__close-c158a550a9982aa92801c046548d72945aa912de6f2a012513132fdc02dfc379.png)
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
![](https://cdn.jiqizhixin.com/assets/science-ai__qr-code-a12e4635c8d3968645bd2b6371981b65b0d21058c5a2c216aef80015b4eb7e43.png)
微信扫一扫获取更多资讯
元乘象Chatimg3.0来了,赶超GPT-4V,还给出产业升级新打法
最近,AI 领域都在思考一件事:多模态大模型落地产业,好的打法应该是什么?通用人工智能时代正在到来,AI 大模型技术已成为数字经济下基础设施建设的重要支撑,也成为产业智能化转型的核心「引擎」,AI 大模型 + 产业应用迎来了前所未有的发展机遇。在 10 月 28 日举办的 CNCC 2023「超智融合 AI 大模型应用落地发展论坛」上,智子引擎发布了「元乘象 Chatimg3.0」,展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。元乘象 Chatimg3.0 是一个超精细识别、少幻觉的多模态大模型,同时支持多图理解、物体定位、OCR 等功能。Chatimg3.0 给硬件设备装上了大脑,可实现更自然更流畅的人机交流,为 AI 多模态大模型赋能产业应用打下了坚实的基础。与 Chatimg2.0 相比,Chatimg3.0 主要进行了两方面的升级,包括第一阶段的预训练(描述、检测、OCR 等多任务训练)以及第二阶段的指令微调(高质量的人工精筛指令集)。为更好的评估多模态大模型的能力,智子引擎构建了一个全新的多模态对话测试集,从描述、推理、检测、问答、业务五个方面对模型能力进行评测,而且在问答和业务两个方面的能力上赶超 GPT-4V,展现出了国产大模型优秀的发展潜力。 ![图片](https://image.jiqizhixin.com/uploads/editor/41783b1a-6014-475b-8bdb-ccba35e25ecc/640.png)
以下是 Chatimg3.0 对比 GPT-4V 在测试中的具体表现:![图片](https://image.jiqizhixin.com/uploads/editor/c6d25a32-f3c9-408c-a448-c1dfd14a55be/640.png)
左:Chatimg3.0,右:GPT-4V。
![图片](https://image.jiqizhixin.com/uploads/editor/785088f2-5f76-491d-adfd-b942d3c1015b/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/c6d251d2-725f-4beb-94b1-aaf1b629e9ea/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/be36ea60-5261-4090-97cc-07a170f0b046/640.png)
目前,智子引擎已经将「元乘象 Chatimg3.0」应用于全域防控和无人机巡检等领域,通过与无人机、电子探头等前端感知设备的融合,升级传统巡检和安防,实现了 AI 缺陷识别、异常检测、行为分析、重点监控、自主巡查、风险预测等功能,推动了 AI 工程化革新进程。![图片](https://image.jiqizhixin.com/uploads/editor/410d9f6f-439d-472d-82c4-076b9f982ebb/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/ce1acb0a-f533-4c09-9613-98e6b96187f9/640.png)
作为国内首个多模态大模型研发团队,智子引擎不仅在人才和技术上拥有先天的优势,多个知名投资机构和 IT 行业龙头的天使投资,也让这家公司「如虎添翼」。在软通动力、华软科技等知名企业的协同助力下,融合「元乘象 Chatimg3.0」研发的「智子・天穹」和「智子・天巡」系统一经面世便得到了行业的关注,产品被快速应用于城市治理、智慧电力、管道巡检、园区管理、农业、金融等多行业应用场景,并逐步开始试点部署。![图片](https://image.jiqizhixin.com/uploads/editor/4d937f95-27d9-44e1-8d73-d29ff1109951/640.png)
未来,为了加速大模型产业应用落地,促进数字经济可持续发展,智子引擎将继续加强模型训练和能力升级,汇聚行业顶尖人才和优势资源,为大模型助力产业升级不遗余力。核心模型 「元乘象 Chatimg」未来还会在 AI agents、具身智能等方向持续发力,并将收获更多行业关注。