
网站状态:
BigBang Transformer[乾元]是基于GPT Decoder-only架构的大规模预训练模型。继2022年开源BBT-1-0.2B模型之后,我们正式开源最新系列的BBT模型:BBT-1-1B,BBT-2-12B-Text,BBT-2.5-13B-Text。预训练语料库覆盖14个高质量数据源,覆盖书籍、百科、论文、小说、新闻、政策文件、中文博客、社交媒体等多个数据源种类。BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。
网站特色:
模型开源后所有开发者可以:
1. 可以直接调用大模型进行对话
2. 在我们训练的基础上使用自由语料库继续训练
3. 对大模型进行微调训练以满足各种下游任务
网站操作:
导航号正在努力测试中。。。
优点缺点:
导航号正在努力筹备中。。
数据统计
数据评估
关于乾元特别声明
本站IE网址导航号提供的乾元都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由IE网址导航号实际控制,在2023-11-20 11:05收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,IE网址导航号不承担任何责任。
相关导航

MiniMax 开放平台

Cohere
Cohere | 构建AI产品的大语言模型平台 | AI训练模型

西湖心辰
西湖心辰是专注于人工智能服务研发的科技公司,旗下产品有「Friday」、「造梦日记」、「聊会小天」、「心辰智能云」等,为个人用户和企业用户提供全链路 AIGC 和人工智能技术服务。

Auto-GPT
Auto-GPT | 爆火的实现GPT-4完全自主的实验性开源项目,GitHub超10万星 | AI训练模型

智谱清言
中国版对话语言模型,与GLM大模型进行对话。

LLMZoo
LLM Zoo是一个为大型语言模型提供数据、模型和评估基准的项目

MediaGPT
虽然LLaMA模型在通用领域通过指令微调已经展示出了令人印象深刻的性能,但对于自媒体创作、直播和运营等领域,由于缺乏专业的训练数据,其能力仍有待提高。为了解决这个问题,我们提出了MediaGPT,一个针对自媒体领域进行特殊训练的模型。gether. Contribute to the open source community, manage your Git repositories, review code like a pro, track bugs and features, power your CI/CD and DevOps workflows, and secure code before you commit it.

紫东太初多模态大模型
面向企业提供一站式研发管理解决方案,包括代码管理、项目管理、文档协作、测试管理、CICD、效能度量等多个模块,支持SaaS、私有化等多种部署方式,帮助企业有序规划和管理研发过程,提升研发效率和质量。
暂无评论...


