• 简体   /   繁体
面向医学领域生成任务的大语言模型性能评测研究-电脑知识与技术2025年04期

面向医学领域生成任务的大语言模型性能评测研究

作者:蔡文涛 丁增辉 李梦 刘惠临 常征 字体:      

摘要:文章针对医学领域大语言模型评测的不足,构建了4个医学评测任务,并选取8个中文开源大语言模型进行性能评估。结果表明,通用模型 Qwen2.5-7B-Instruct 表现最佳,而现有开源医学领域大语言模型的性能相对较差。(试读)...

电脑知识与技术

2025年第04期