摘要: 借助科技差距概念识别技术机会已得到学术界关注,然而鲜有研究考虑科技文献深层语义特征的挖掘,进而提高技术机会识别结果的可解释性。研究提出SAO语义结构与BERTopic相结合的方法,基于深度预训练语言模型输出科技文献与带有SAO语义标注的技术术语之间的关联矩阵。相继地,在识别科技差距阶段,对于科学文献中技术主题的抽取,采用OPTICS和DBSCAN相结合算法,该算法能够在主题聚类的同时完成对离群点的检测,并且无需复杂的参数调试过程,具有一定的高效性;针对专利文献中技术主题的抽取,运用GTM专利地图的方法识别技术空白点;最后使用TF-IDF的余弦相似度识别并筛选出科学可行的科技差距作为潜在技术机会。研究选取太阳能热发电技术2013-2022年的科技文献为实证案例,检验方法的适用性与有效性,结果显示:论文主题聚类为3类,离群点22个,专利中能反映出有效信息的技术空白点4个,经过科技差距的筛选最终可得4个技术机会,分别是:基于金属、陶瓷和粉末的涂层技术、真空粉末绝热方法、管板式集热器设备和基于氯化物和硝酸盐的熔融盐材料,识别结果与技术实际应用情况相一致。研究丰富并扩展了技术机会识别方法,优化了已有技术机会识别方法的可解释性与高效性,研究结论可以为相关技术领域人员在判别技术发展态势时提供价值参考。