
网站状态:
BigBang Transformer[乾元]是基于GPT Decoder-only架构的大规模预训练模型。继2022年开源BBT-1-0.2B模型之后,我们正式开源最新系列的BBT模型:BBT-1-1B,BBT-2-12B-Text,BBT-2.5-13B-Text。预训练语料库覆盖14个高质量数据源,覆盖书籍、百科、论文、小说、新闻、政策文件、中文博客、社交媒体等多个数据源种类。BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。
网站特色:
模型开源后所有开发者可以:
1. 可以直接调用大模型进行对话
2. 在我们训练的基础上使用自由语料库继续训练
3. 对大模型进行微调训练以满足各种下游任务
网站操作:
导航号正在努力测试中。。。
优点缺点:
导航号正在努力筹备中。。
数据统计
数据评估
关于乾元特别声明
本站IE网址导航号提供的乾元都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由IE网址导航号实际控制,在2023-11-20 11:05收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,IE网址导航号不承担任何责任。
相关导航

模型下载

Gen-2
Gen-2 | Runway最新推出的AI视频生成模型 | AI训练模型

Cohere
Cohere | 构建AI产品的大语言模型平台 | AI训练模型

天工
天工 — 双千亿级大语言模型

快意
独立自主研发的一系列大规模语言模型

Scale AI
Scale AI | AI机器学习标注训练平台 | AI训练模型

达观数据官网
达观数据是国内领先的文本智能处理专家,利用先进的自然语言处理(NLP)达观数据是国内领先的智能文本处理专家, 结合先进的自然语言处理(NLP)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)、知识图谱等技术, 为大型企业和政府机构提供文档智能审阅、智能知识管理、知识搜索与问答、文档智能写作、智能推荐、办公流程自动化等智能文本处理产品。 达观数据通过持续投入研发和创新,不断提升产品和服务的质量与效率,为企业提供更好的文本智能化解决方案,让计算机协助人工完成业务流程自动化, 大幅度提高企业效率与智能化水平。

通义大模型
阿里大模型统一品牌,覆盖语言、听觉、多模态等领域;致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”
暂无评论...