solidot新版网站常见问题,请点击这里查看。

IBM 和 NASA 训练大模型促进科学知识的可及性

NASA 人工智能
Wilson (42865)发表于 2024年03月14日 16时06分 星期四

来自气球上的五星期
IBM 和 NASA 合作使用科学文献训练大模型促进科学知识的可及性。模型是基于 Transformer 架构,可用于分类到实体抽取(entity extraction)到问答和信息检索等不同应用。IBM-NASA 模型使用了天体物理学、行星科学、地球科学、太阳物理学以及生物和物理科学数据集的 600 亿个令牌进行训练,在评估生物医学任务表现的 BLURB 基准测试中的得分比开源模型 RoBERTa 高 5%。两个模型都开源发布在 Hugging Face 上。


https://research.ibm.com/blog/science-expert-LLM
https://huggingface.co/nasa-impact/nasa-smd-ibm-v0.1
https://huggingface.co/nasa-impact/nasa-smd-ibm-st