一见

2年前发布 184 00

“一见”取义自“百闻不如一见”，是一个侧重视觉能力的多模态对话大模型，基于单模态专家缝合路线（Single-modal Experts Efficient integration, SEEChat）。

所在地：

新加坡

语言：

收录时间：

2023-11-16

打开网站手机查看

训练模型

一见

打开网站

网站简介：（通用）

SEEChat – 一见多模态对话模型

“一见”取义自“百闻不如一见”，是一个侧重视觉能力的多模态对话大模型，基于单模态专家缝合路线（Single-modal Experts Efficient integration, SEEChat）。
SEEChat项目的重点是将视觉能力与文本对话能力相集成，长期目标是赋予模型以文本/对话的方式解决视觉任务（图像理解，目标检测，跨模态，开放集）的能力
“一见”多模态对话模型是SEEChat的开源版本，语言模型部分基于中文ChatGLM6B

能力展示

1. 多轮视觉问答、代码生成、目标分类

2. Image Captioning

从中文Zero数据集中随机选取1000张中文互联网图像，已排除训练集数据
使用ChineseCLIP计算图文相关性得分
上图为七种公开方法（原生的互联网文本做为其中一种）的图文相关性得分胜出情况
SEEChat胜出率甚至大比例超过原生文本

技术方案

SEEChat基于单模态专家缝合路线，通过可学习的桥接层将视觉模态的专家模型与文本模态的专家模型进行缝合，形成具备视觉理解能力的多模态对话模型。

开源V1.0版本的SEEChat，视觉模态基于CLIP-ViT，文本模态基于ChatGLM，可学习的桥接层参考BLIP-2以及LLAVA等前期工作，进行如下的两阶段训练：

Stage I 图文对齐: 使用360人工智能研究院开源的Zero数据集，共计2300万图文对桥接层进行训练
Stage II 人机对齐：使用LLAVA开源的158K instruction数据经翻译后，对桥接层和语言模型部分进行微调

使用说明

硬件说明

GPU要求3090或者A100

环境安装

conda env create -f environment.yml

模型与数据

模型下载

从这里下载chatGLM所有的bin文件和ice_text.model，放于目录models/chatglm-6b中。
从百度云盘下载权重文件checkpoint_100.pth，放于目录models/chatglm-6b中。其中提取码为 qiho

运行推理脚本

进入到目录： cd code
运行启动脚本： sh demo_stage2.sh

启动后，即将开始一轮对话。当命令行显示“question”时，用户可以在终端输入问题，由seechat回答。当输入“break”时，本轮对话结束，进行下一轮对话。实测效果如下：

中文

X-LLM: 5月7日公开，中科院自动化所
VisualGLM: 5月18日公开，清华大学KEG组
mPLUG-Owl: 4月26日公开，阿里达摩院

英文

BLIP-2: 1月30日公开，Salesforce
LLaVA: 4月17日公开，威斯康星大学麦迪逊分校，微软研究院和哥伦比亚大学
MiniGPT-4: 4月19日公开，King Abdullah University of Science and Technology

数据统计

数据评估

一见浏览人数已经达到184，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：一见的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找一见的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站IE网址导航号提供的一见都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由IE网址导航号实际控制，在2023-11-16 17:53收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，IE网址导航号不承担任何责任。

IE网址导航号致力于优质、实用的网络站点资源收集与分享！本文地址https://www.iesofts.com/sites/25563.html转载请注明

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

一见

欢迎指数：

网站简介：（通用）

SEEChat – 一见多模态对话模型

能力展示

1. 多轮视觉问答、代码生成、目标分类

2. Image Captioning

技术方案

使用说明

硬件说明

环境安装

模型与数据

模型下载

运行推理脚本

相关工作

中文

英文

数据统计

数据评估

相关导航

Segment Anything

OpenBMB

AgentGPT

揽睿Ai

商量SenseChat

豆包

Cohere

MathGPT

暂无评论

网址热榜

van Schneider

pixabay

双色球模拟摇奖器模拟自动选号机

第一故事

清博大数据 – 清博指数

济宁医学院

加入收藏夹

设为首页

一见

欢迎指数：

网站简介：（通用）

SEEChat – 一见多模态对话模型

能力展示

1. 多轮视觉问答、代码生成、目标分类

2. Image Captioning

技术方案

使用说明

硬件说明

环境安装

模型与数据

模型下载

运行推理脚本

相关工作

中文

英文

数据统计

数据评估

相关导航

Segment Anything

OpenBMB

AgentGPT

揽睿Ai

商量SenseChat

豆包

Cohere

MathGPT

暂无评论

网址热榜

van Schneider

pixabay

双色球模拟摇奖器 模拟自动选号机

第一故事

清博大数据 – 清博指数

济宁医学院

热门标签

加入收藏夹

设为首页

双色球模拟摇奖器模拟自动选号机