
网站状态:
网站简介:
K2是一个地球科学的开源大预言模型。首先通过收集和清理的地球科学文献(包括地球科学开放获取论文和维基百科页面)对 LLaMA 进行进一步预训练,然后使用知识密集型指令调优数据(GeoSignal )。
初步评估采用GeoBenchmark(由NPEE和AP Test on Geology、Geography、Environmental Science组成)作为基准。与具有相似参数的几个基线模型相比,K2 在客观和主观任务上的表现优于基线。
我们介绍 K2 (7B),它是一个开源语言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调。在初步评估中,我们使用 GeoBench(由 NPEE 和关于地质学、地理学和环境科学的 AP 测试组成)作为基准。与参数相似的几个基准模型相比,K2 在客观和主观任务上的表现都优于基准模型。在该资源库中,我们将共享以下代码和数据。
网站特色:
导航号正在努力测评中。。。
网站操作:
导航号正在努力测试中。。。
优点缺点:
导航号正在努力筹备中。。
数据统计
数据评估
关于K2-上海交通大学特别声明
本站IE网址导航号提供的K2-上海交通大学都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由IE网址导航号实际控制,在2024-04-19 13:55收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,IE网址导航号不承担任何责任。
相关导航

“灵云科技 源自清华 服务全球”的发展战略

乾元BigBangTransformer
BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。

酷芯微电子
应用于智能安防、智能硬件、智能车载等多个领域。

MediaGPT:中文自媒体大模型
一个针对自媒体领域进行特殊训练的模型

右脑科技
右脑科技是一家成立于2022年9月的初创公司,专注于研发AI图像和视频生成技术。该公司致力于将AIGC技术应用于图像及视频领域,以AI赋能创作,让想象成为具象。

寒武纪
打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片

思腾合力
行业领先的人工智能基础架构解决方案商

清微智能
可重构计算芯片领导企业,提供以端侧为基础
暂无评论...