
网站状态:
BigBang Transformer[乾元]是基于GPT Decoder-only架构的大规模预训练模型。继2022年开源BBT-1-0.2B模型之后,我们正式开源最新系列的BBT模型:BBT-1-1B,BBT-2-12B-Text,BBT-2.5-13B-Text。预训练语料库覆盖14个高质量数据源,覆盖书籍、百科、论文、小说、新闻、政策文件、中文博客、社交媒体等多个数据源种类。BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。
网站特色:
模型开源后所有开发者可以:
1. 可以直接调用大模型进行对话
2. 在我们训练的基础上使用自由语料库继续训练
3. 对大模型进行微调训练以满足各种下游任务
网站操作:
导航号正在努力测试中。。。
优点缺点:
导航号正在努力筹备中。。
数据统计
数据评估
关于乾元特别声明
本站IE网址导航号提供的乾元都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由IE网址导航号实际控制,在2023-11-20 11:05收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,IE网址导航号不承担任何责任。
相关导航

Imagen | Google AI文字到图像生成模型 | AI训练模型

阅文集团
一家以数字阅读为基础,IP培育与开发为核心的综合性文化产业集团

魔搭社区
魔搭社区 | 阿里达摩院推出的AI模型社区,超过300+开源AI模型 | AI训练模型

豆包
豆包是你的智能小助手,可以为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题。

Cohere
Cohere | 构建AI产品的大语言模型平台 | AI训练模型

言犀
言犀,京东智能人机交互平台,懂业务更懂你,是融合京东自身十年客户服务与营销的最佳实践以及自研全链路AI能力的服务数智化平台级产品。为政务、金融、零售、教育等行业领域提供以用户为中心的客户服务、营销、流程自动化的新一代智能化解决方案,助力客户实现服务数智化转型。

腾讯混元
腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。

达摩院
提供大数据和AI场景下的最佳实践案例,一站式引导体验帮您快速了解DataWorks、MaxCompute、机器学习PAI、Hologres、Flink等产品能力和解决方案,降低企业上云成本。
暂无评论...


