斯坦福大学将开发AI数据提取框架,以提供解决能
栏目:公司新闻 发布时间:2025-05-26 10:24
图丨陈震林(来源:陈震林)资料来源:精确的DeepTech评估和减少温室气体泄漏的释放是能源领域的主要挑战,但是石油和天然气行业的基本数据通常散布在昂贵的商业数据库中,碎片,杂乱和稀缺。此外,该领域的官方数据更新有点捕获,传统的Manu -Manu -Aclecition方法无效,容易出现错误。为了应对上述问题,斯坦福大学学习的医生陈·辛林(Chen Zhenlin)和他的研究团队开发了基于大语言模型的创新框架。该技术使用对大型文本(GPT-4和GPT-4O)(比传统的文本识别技术更多)的文本有很好的了解,以有效地从石油和天然气领域的Papublic文献中提取基本数据(包括多变量数据格式,例如学术期刊论文和新闻报道)。该大纲显示了两个主要好处:一个是经济有很大的好处改进,通过优化GPT-4O应用程序,单个数据提取成本降低了10倍(0.04美元);其他人则很棒,在测试数据集中获得了83.74%的精度,F1得分为78.16%,通过包含的多源信息确认了灵活性和可靠性。据报道,这是石油和天然气领域的第一个斯坦福大学团队申请。该工具不仅可以解决传统数据获取的问题,而且还为准确评估温室气体泄漏和完整的生命周期检查提供了可靠的支持,这最终使科学政策和环境管理决策的制定效果决定了。照片| Chen Zhenlin(起源:Chen Zhenlin)最近,与-way论文有关Energy和AI [1]的发表,标题是“通过删除语言数据的大型语言”的标题“先进的石油进步和气体排放”。斯坦福大学博士生陈·辛林(Chen Zhenlin)担任F第一和相关集。照片|相关论文(来源:能源和AI)更改此框架在于使用大型模型(例如GPT-4和GPT-4O)通过迭代优化的及时及时的及时及时(及时的工程)来大量提取石油和天然气行业中的关键数据。为了验证该过程的有效性,研究团队首先构建了一个包含108个MGA文档的专业数据集,其中涵盖了51个主要参数,例如气体油比和水油比,并使用了对现场专家的手动注释来促进基准数据来提高模型的准确性。图丨大型模型的过程分为三个阶段:数据准备(绿色),大型管道(橙色)和结果改进(蓝色)(蓝色)(来源:能量和AI)陈·Zhenlin进一步向DeepTech解释:“我们整合了域专业知识和数值计算方法,包括方程和热力学方程。响应这些问题的问题。SE,训练后的准确性从最初的63.6%增加到83.74%(下表)。 MANU -MANU -PROCEDURE的显着改善数据获取的迭代及时工程工程基于大型模型(来源:能源和AI),该研究团队不仅建立了一个系统的程序来优化即时的系统,而且还探索了完全利用大型模型的潜力的技术途径,该方法提供了能源领域。在中游和下游链接上获取数据的任务。 “我们致力于开发具有转移学习能力的框架系统,以便它可以通过示例中的Mekanismo研究在不同的应用程序情况下创建一个新值,并将其应用于另一个。”表|大型模型框架以及GPT-4和GPT-4O测试结果(来源:能源和AI)在未来的研究阶段,研究人员计划继续优化准确性和体系结构。 Chen Zhenlin说:“我们只能在这样做时依靠GPT研究,但是现在,在大型模型的持续变化和开发中,许多模型,许多模型都可能是DeepSeek,可以阅读文献并交叉验证该模型的可靠性。 “ Sa Kasalukuyan,SI,SI Long Wennan Mula Sa Koponan Ay Nakumpleto Ang angmalalim na pag-aaral sa pandaigdigang mga pagkkalla pagkkallula ng天然na气体碳排放aplikasyon ng agos,在Ang Mga Nauugnay na papel ay pumasok sa yugto ng ng pagsumite,研究人员还计划使用更深入的范围,以确定大型误差率。这些发现将直接指导随后的模型优化。” Chen Zhenlin说。在本研究的上游链接中借出了审查,并将重点介绍对中游和下游的全面分析。 Chen Zhenlin说:“我们希望这项研究是深层整合AI和能源领域的重要任务,这为全球气候政策的科学制定提供了基本数据支持。”参考材料:1。ZhenlinChen等。通过大量删除语言数据的语言进行石油分析和气体排放的进展。能源和AI(2025)。 https://doi.org/10.1016/j.egyai.2025.100481操作/类型:He Chenlong
服务热线
400-123-4567