-
油气公司在科研、生产、管理、经营活动中积累了海量的结构化及非结构化数据,其数据总量仍在不断持续攀升,充分挖掘这些数据的价值是非常重要和十分迫切的,尤其是在低油价时期。据统计,非常规油气钻井作业产生的数据非常庞大,每英尺钻井产生的数据量就能达到1MB,每打一口井产生的数据量能达到1~15 TB,如何挖掘和利用钻完井大数据蕴含的价值,为钻完井提供优质方案,将是未来很长一段时间面临的科学技术问题。
随着钻井数据信息采集技术的迅速发展,钻井过程中产生的数据体量庞大,机器学习能够精准地对海量钻井数据进行分析,从中发现一定的规律,为高效率钻井提供结构化的信息和指导,目前许多新的机器学习方法都被应用于钻头优选、钻头性能评价、机械钻速的预测与优化、钻井过程中的事故预测与解决方法、钻井液的优选、综合系统的构建等方面。准确预测并优化机械钻速是缩短钻井周期、节省钻井成本的良好方法,将人工智能方法与钻井结合是目前的研究趋势[1]。笔者总结分析了人工智能方法预测机械钻速的研究进展,指出了目前研究存在的一些问题,主要针对相关性分析、数据选取及对训练和预测结果的影响开展了研究。
-
钻井机械钻速(ROP)预测是进行钻井优化、钻井投资测算等工作的重要技术内容,目前建立的传统机械钻速方程有几十种之多[2],但影响机械钻速的因素繁多,关系复杂,目前为止尚未建立令人信服、普遍适用的数学模型,而随着带有数据驱动特性的人工智能方法在工程领域的应用越来越广泛,使用人工智能算法预测机械钻速受到研究学者的广泛关注。Moran等[3]指出基于推测或假设出的机械钻速在未知区域估计钻井时间的传统方法可以被人工神经网络所取代;Soares等[4]揭示了传统机械钻速模型的局限性,包括Bourgoyne的机械钻速模型[5];Jahanbakhshi等[6]将影响机械钻速的不同钻井参数放入人工神经网络进行训练,得出预测结果最高的参数组合;Hegde等[7]使用了多种人工智能算法对机械钻速进行预测,表示人工智能算法的灵活性可以适用于常规井与非常规井的机械钻速预测。近年来众多专家学者基于人工智能算法预测机械钻速的研究见表1。
表 1 近年人工智能预测机械钻速方法汇总
Table 1. Summary of methos predicting penetration rate with artificial intelligence in recent years
作者 使用算法 模型参数 训练数据量 Moran[3] 神经网络 岩石强度、岩石类型、钻压、转速、钻头磨损、钻井液密度 Arabjamaloei[8] 神经网络、遗传算法 井深、转速、钻头水力参数、钻头磨损、钻井液密度、水头高度 330组 Bataee[9] 神经网络、遗传算法 钻头直径、深度、钻压、转速、钻井液密度 1 810组 Bhatnagar[10] 神经网络 转速、钻压、钻井液类型、岩石抗压强度 472组 Bodaghi[11] 神经网络、支持向量机 钻井液黏度、钻井液密度、排量、泵压、井斜角、转速、钻压、钻井间隔、地层岩性、钻头尺寸、钻头磨损 193组 Hegde[12] 宽窗口统计学习模型 转速、钻压、流速、岩石抗压强度 单口油井 Mantha[13] 支持向量机、神经网络、K-邻近、
决策树、随机森林、梯度提升机转速、流量、钻压、自然伽马、地层数据 5口井数据,每口井数据大于36 000条 Diaz[14] 神经网络 井深、孔隙压力、钻井液密度、钻头质量除以直径、转速、钻头磨损、雷诺数 韩国单井,
测量深度4 127 mEskandarian[15] 随机森林,多层感知器 井深、钻压、转速、流速、泵压、井斜角、方位角、深度、钻井液密度、漏斗黏度、塑性黏度、屈服值、10 s胶凝强度、10 min胶凝强度 3口井 王文[16] 神经网络 转速、钻压、钻井液密度、排量、岩石强度、钻头直径、钻具类型 近7 000组 Hegde[17] 混合模型 转速、钻压、流速、岩石抗压强度 6 001~9 128 ft
垂直钻井资料Abbas[18] 神经网络 井深、钻压、转速、扭矩、钻头类型、泵压、总喷嘴或流动面积(TFA)、钻井液密度、井眼轨迹方位角与井斜角、岩石抗压强度、孔隙压力、地应力、井深 13125组 刘胜娃[19] 神经网络 钻头尺寸、钻压、泵压等11个字段 2927组 Kor[20] 支持向量机,多元回归 井深、钻压、转速、孔隙压力、钻井液密度、水力参数 55组 许明泽[21] 集成模型 井深、钻压、泵压、转速、密度、黏度、排量 1585组 人工智能方法提供了预测机械钻速的新思路,但影响机械钻速的因素繁多,有些因素(如岩石强度、钻头磨损)不是很好获得,这些因素是否要作为输入参数放入模型,在已有文章中选取的输入参数是否忽略了某些重要变量也不得而知。为优化机械钻速,提高钻井效率,Graham等[22]分析了钻井效率与机械钻速的关系,表示机械钻速不等同于钻井效率,而应被视为影响钻井效率的几个因素之一;Hedge等[23]从单一的机械钻速优化模型,转为多目标的模型,将机械钻速、机械比能、扭矩3种因素交互评估,从而获得最佳的钻井方案。
以上调研文献中,大多数训练模型所用数据是基于单井或井段数据,人工智能模型很好地预测了机械钻速,且对数据采取K折交叉验证[15, 19, 21]找到模型泛化能力最优的超参数组合,或是用其他方法直接优化超参数[8-9, 14, 17]以提高预测精度。但若仅使用单井或少量数据训练模型,会使模型输入数据不具备代表性,因此模型无法向其他井或者整个区块进行推广,在预测其他井钻速时还需重新训练模型,不符合工程需要。
-
由表1可以看到,使用人工智能方法预测机械钻速选择的输入参数各不相同。研究表明[12, 20]可以应用相关性分析找到对机械钻速影响最大的几个参数,并使用这些参数进行机械钻速的预测与优化。但在实际工程中所获得的钻井日志,可能并不会含有某些关键因素(如钻头磨损),在对这些钻井参数进行相关性分析过程中,可能会由于数据问题将一些相关性低的重要因素忽略掉。李谦等[24]分析了基于人工智能方法的钻速预测模型数据有效性下限,表明在引入足够的参数后,无论引入参数的相关性高低,都可取得较高的预测精度。笔者将原始钻井数据进行了相关性分析,发现有些相关性分析可能得出错误的结论。图1将某井的输入参数与机械钻速进行相关性分析,发现钻压、转速与钻速不是想象中的正相关。这是因为随着钻井深度的增加,井下的情况越来越复杂,虽然增加了钻压,但机械钻速仍然可能降低。图2选取了图1中某井二开井段数据做了相关性分析,可以看到全井的相关性分析与某井段的相关性分析结果差距较大。故使用相关性分析去寻找输入参数或是删除某些分析出来的相关性低的因素尚需讨论。
-
钻井会产生大量井数据,但在使用人工智能方法进行钻速预测与钻井优化时,许多调研的文献中仅仅只用一口井或是某一段钻井数据进行尝试。训练数据量的多少会影响人工智能方法预测的精度,从而影响对人工智能模型的选择。Korhan等[20]研究表明在训练数据有限的情况下,支持向量机可以更准确地预测机械钻速;Yavari等[25]研究表明在数据量较大时,自适应神经模糊推理系统更适合预测机械钻速。人工智能模型预测的准确度基于输入数据,将超出输入数据范围外的数据输入模型训练将会得到不确定的结果,使用单井数据或是某井段数据进行模型训练和训练是否具有良好的泛化能力值得讨论。
为了使预测模型具有泛化能力,Hedge等[26]将数据集按岩性拆分,基于不同岩性分别建立人工智能模型。该模型可以更加准确地预测对应岩性地层的机械钻速。笔者将区块数据与单井数据分别使用人工智能模型进行训练,扩大了输入数据的范围,使得模型在该地层更具泛用性。
笔者收集了四川盆地某开发区块的钻井数据,使用随机森林(RF)[27]、支持向量机(SVR)[28]、人工神经网络(ANN)[29]以及梯度提升树(GBDT)[30]等4种算法,分别对该开发区块的单井与区块的机械钻速进行预测,并且在已有钻井参数(钻压、转速、泵压、钻井液密度、黏度、排量)的基础上,引入地层参数(井深、岩性、声波时差、自然伽马)和钻头参数(钻头型号、开次)作为输入参数,对其中非结构化参数(钻头型号、岩性)进行编码,并与其他参数一样进行归一化处理。在下文所有机械钻速预测模型中,数据集将按照训练集80%、验证集20%的方式送入模型训练,并且采用可决系数R2作为模型精度的评价指标[19]。
-
4种人工智能算法对某单井数据进行机械钻速预测结果如图3所示,可以看出,随机森林与梯度提升树可决系数可以达到0.92,支持向量机和人工神经网络的可决系数分别为0.88,0.90。
-
使用4种人工智能算法对某区块进行机械钻速预测,区块数据包括在此区块的5口井,数据量为15 317组。机械钻速预测结果如图4所示,可以看出,随机森林可决系数可以达到0.88,支持向量机、人工神经网络和梯度提升树的可决系数分别为0.86、0.74、0.85。结果表明,人工智能方法可以对单井或是区块的机械钻速进行良好的预测,且随机森林方法对于机械钻速的预测更为优秀。
-
将训练好的单井与区块的随机森林模型分别保存,将新井数据输入后,对比二者模型的泛化能力。图5为使用单井数据训练出的随机森林模型预测该区块其他单井的结果,可决系数分别为0.16、0.13、0.13;图6为使用区块数据训练出的随机森林模型预测该区块其他单井的结果,可决系数分别为0.91、0.76、0.91。结果显示区块数据训练后的模型在此区块对新井数据具有更好的泛化能力。
-
(1)人工智能方法在各个学科应用广泛,国内外使用人工智能方法预测机械钻速已取得良好的成效,但由于训练出的人工智能模型泛化能力低,该方法还未在工程上得到广泛应用。
(2)采用相关性分析方法分别对整个单井数据与该井二开数据进行相关性分析,发现参数之间的相关性在一口井内都有较大差异。故使用相关性分析去寻找输入参数或是删除某些相关性低的输入参数尚需讨论。
(3)将新井数据作为验证集,测试单井与区块数据训练后的随机森林模型泛化能力,得到区块数据训练的模型在此区块的泛用性远好于单井数据所训练的模型。这表明使用区块数据训练的模型具有较高的泛化能力,认为该模型能够推广至整个区块,有利于指导该区块的钻井工程技术优化。
Discussion on the application of artificial intelligence method to the prediction of drilling machinery ROP
-
摘要: 人工智能方法被广泛地用于预测钻井过程中的机械钻速,虽预测精度都能超过80%,但以前的算法大多仅选取一口井或一个开次的数据进行预测和检验,缺乏对邻井或整个区块推广和预测的研究,泛化能力有待检验。针对上述问题,讨论了相关性分析在机械钻速预测中对钻井参数选取的影响以及训练数据选取对人工智能模型泛用能力问题。引入地层参数、钻头参数及钻井参数作为输入参数,选取四川盆地某区块的实际钻井数据进行训练,评价了随机森林、支持向量机、梯度提升树、人工神经网络4种人工智能算法对整个区块机械钻速预测的精度。结果显示,随机森林算法对区块内各单井数据的预测精度能达到90%,对整个区块数据预测的准确度能达到88%,且使用区块数据训练的随机森林模型具有较好的泛化能力,认为该方法能够推广至整个区块,有利于指导该区块的钻井工程技术优化。Abstract: Artificial intelligence methods are widely used to predict the rate of penetration in the drilling process. Although the prediction accuracy can exceed 80%, most of the previous algorithms only select the data from one well or one drilling section for prediction and inspection, lacking the research on the generalization and prediction of adjacent wells or the whole block. Therefore, the generalization ability of these algorithms needs to be tested. In view of the above problems, the influence of correlation analysis on drilling parameter selection during prediction the rate of penetration and the influence of training data selection on the generalization ability of artificial intelligence models were discussed. The formation parameters, drill bit parameters and drilling parameters were introduced as input parameters, and the actual drilling data of a block in the Sichuan Basin was selected for training. The accuracy of 4 artificial intelligence algorithms, that is random forest, support vector machine, gradient boosting tree and artificial neural network, were evaluated for predicting the penetration rate of the entire block. The results show that the prediction accuracy of the random forest algorithm for the data of each single well in the block can reach 90%, and the prediction accuracy for the data of the whole block can reach 88%. The random forest model trained with the block data has better generalization ability, it is believed that this method can be extended to the whole block, which is beneficial to guide the optimization of drilling engineering technology in this block.
-
表 1 近年人工智能预测机械钻速方法汇总
Table 1. Summary of methos predicting penetration rate with artificial intelligence in recent years
作者 使用算法 模型参数 训练数据量 Moran[3] 神经网络 岩石强度、岩石类型、钻压、转速、钻头磨损、钻井液密度 Arabjamaloei[8] 神经网络、遗传算法 井深、转速、钻头水力参数、钻头磨损、钻井液密度、水头高度 330组 Bataee[9] 神经网络、遗传算法 钻头直径、深度、钻压、转速、钻井液密度 1 810组 Bhatnagar[10] 神经网络 转速、钻压、钻井液类型、岩石抗压强度 472组 Bodaghi[11] 神经网络、支持向量机 钻井液黏度、钻井液密度、排量、泵压、井斜角、转速、钻压、钻井间隔、地层岩性、钻头尺寸、钻头磨损 193组 Hegde[12] 宽窗口统计学习模型 转速、钻压、流速、岩石抗压强度 单口油井 Mantha[13] 支持向量机、神经网络、K-邻近、
决策树、随机森林、梯度提升机转速、流量、钻压、自然伽马、地层数据 5口井数据,每口井数据大于36 000条 Diaz[14] 神经网络 井深、孔隙压力、钻井液密度、钻头质量除以直径、转速、钻头磨损、雷诺数 韩国单井,
测量深度4 127 mEskandarian[15] 随机森林,多层感知器 井深、钻压、转速、流速、泵压、井斜角、方位角、深度、钻井液密度、漏斗黏度、塑性黏度、屈服值、10 s胶凝强度、10 min胶凝强度 3口井 王文[16] 神经网络 转速、钻压、钻井液密度、排量、岩石强度、钻头直径、钻具类型 近7 000组 Hegde[17] 混合模型 转速、钻压、流速、岩石抗压强度 6 001~9 128 ft
垂直钻井资料Abbas[18] 神经网络 井深、钻压、转速、扭矩、钻头类型、泵压、总喷嘴或流动面积(TFA)、钻井液密度、井眼轨迹方位角与井斜角、岩石抗压强度、孔隙压力、地应力、井深 13125组 刘胜娃[19] 神经网络 钻头尺寸、钻压、泵压等11个字段 2927组 Kor[20] 支持向量机,多元回归 井深、钻压、转速、孔隙压力、钻井液密度、水力参数 55组 许明泽[21] 集成模型 井深、钻压、泵压、转速、密度、黏度、排量 1585组 -
[1] 李根生, 宋先知, 田守嶒. 智能钻井技术研究现状及发展趋势[J]. 石油钻探技术, 2020, 48(1):1-8. doi: 10.11911/syztjs.2020001 LI Gensheng, SONG Xianzhi, TIAN Shouceng. Intelligent drilling technology research status and development trends[J]. Petroleum Drilling Techniques, 2020, 48(1): 1-8. doi: 10.11911/syztjs.2020001 [2] 林元华, 宗玉宇, 梁政, 等. 石油钻井机械钻速预测研究进展[J]. 石油钻探技术, 2004, 32(1):10-13. doi: 10.3969/j.issn.1001-0890.2004.01.007 LIN Yuanhua, ZONG Yuyu, LIANG Zheng, et al. The developments of ROP prediction for oil drilling[J]. Petroleum Drilling Techniques, 2004, 32(1): 10-13. doi: 10.3969/j.issn.1001-0890.2004.01.007 [3] MORAN D P, IBRAHIM H F, PURWANTO A, et al. Sophisticated ROP prediction technology based on neural network delivers accurate results[C]//Paper presented at the IADC/SPE Asia Pacific Drilling Technology Conference and Exhibition, November 2010, Ho Chi Minh City, Vietnam: SPE-132010-MS. [4] SOARES C, DAIGLE H, GRAY K. Evaluation of PDC bit ROP models and the effect of rock strength on model coefficients[J]. Journal of Natural Gas Science and Engineering, 2016, 34: 1225-1236. doi: 10.1016/j.jngse.2016.08.012 [5] BOURGOYNE A T, YOUNG F S. A multiple regression approach to optimal drilling and abnormal pressure detection[J]. Society of Petroleum Engineers Journal, 1974, 14(4): 371-384. doi: 10.2118/4238-PA [6] JAHANBAKHSHI R, Keshavarzi R, Jafarnezhad A. Real-time prediction of rate of penetration during drilling operation in oil and gas wells[C]//Paper presented at the 46th U. S. Rock Mechanics/Geomechanics Symposium, June 2012, Chicago, Illinois: ARMA-2012-244. [7] HEGDE C, WALLACE S, TREES G U. Using trees, bagging, and random forests to predict rate of penetration during drilling[C]//Paper presented at the SPE Middle East Intelligent Oil and Gas Conference and Exhibition, September 2015, Abu Dhabi, UAE: SPE-176792-MS. [8] ARABJAMALOEI R, SHADIZADEH S. Modeling and optimizing rate of penetration using intelligent systems in an Iranian southern oil field (Ahwaz Oil Field)[J]. Petroleum Science and Technology, 2011, 29(16): 1637-1648. doi: 10.1080/10916460902882818 [9] BATAEE M. Application of artificial intelligent systems in ROP optimization: A case study in Shadegan Oil Field[C]//Paper presented at the SPE Middle East Unconventional Gas Conference and Exhibition, January 2011, Muscat, Oman: SPE-140029-MS. [10] BHATNAGAR A, KHANDELWAL M. An intelligent approach to evaluate drilling performance[J]. Neural Computing and Applications, 2012, 21(4): 763-770. doi: 10.1007/s00521-010-0457-6 [11] BODAGHI A, ANSARI H R, GHOLAMI M. Optimized support vector regression for drilling rate of penetration estimation[J]. Open Geosciences, 2015, 7(1): 870-879. doi: 10.1515/geo-2015-0054 [12] HEGDE C, GRAY K E. Use of machine learning and data analytics to increase drilling efficiency for nearby wells[J]. Journal of Natural Gas Science and Engineering, 2017, 40: 327-335. doi: 10.1016/j.jngse.2017.02.019 [13] MANTHA B, SAMUEL R. ROP optimization using artificial intelligence techniques with statistical regression coupling[C]//Paper presented at the SPE Annual Technical Conference and Exhibition, September 2016, Dubai, UAE: SPE-181382-MS. [14] DIAZ M B, KIM K Y, KANG T H, et al. Drilling data from an enhanced geothermal project and its pre-processing for ROP forecasting improvement[J]. Geothermics, 2018, 72: 348-357. doi: 10.1016/j.geothermics.2017.12.007 [15] ESKANDARIAN S, BAHRAMI P, KAZEMI P. A comprehensive data mining approach to estimate the rate of penetration: Application of neural network, rule based models and feature ranking[J]. Journal of Petroleum Science and Engineering, 2017, 156: 605-615. doi: 10.1016/j.petrol.2017.06.039 [16] 王文, 刘小刚, 窦蓬, 等. 基于神经网络的深层机械钻速预测方法[J]. 石油钻采工艺, 2018, 40(增刊):121-124. doi: 10.13639/j.odpt.2018.S0.034 WANG Wen, LIU Xiaogang, DOU Peng, et al. A ROP prediction method based on neutral network for the deep layers[J]. Oil Drilling & Production Technology, 2018, 40(S0): 121-124. doi: 10.13639/j.odpt.2018.S0.034 [17] HEGDE C, SOARES C, GRAY K. Rate of penetration (ROP) modeling using hybrid models: Deterministic and machine learning[C]//Paper presented at the SPE/ AAPG/SEG Unconventional Resources Technology Conference, July 2018, Houston, Texas, USA: URTEC-2896522-MS. [18] ABBAS A K, RUSHDI S, ALSABA M. Modeling rate of penetration for deviated wells using artificial neural network[C]//Paper presented at the Abu Dhabi International Petroleum Exhibition & Conference, November 2018, Abu Dhabi, UAE: SPE-192875-MS. [19] 刘胜娃, 孙俊明, 高翔, 等. 基于人工神经网络的钻井机械钻速预测模型的分析与建立[J]. 计算机科学, 2019, 46(增刊1):605-608. LIU Shengwa, SUN Junming, GAO Xiang, et al. Analysis and establishment of drilling speed prediction model for drilling machinery based on artificial neural network[J]. Computer Science, 2019, 46(S1): 605-608. [20] KOR K, ALTUN G. Is support vector regression method suitable for predicting rate of penetration?[J]. Journal of Petroleum Science & Engineering, 2020, 194: 107542. doi: 10.1016/j.petrol.2020.107542 [21] 许明泽, 韦明辉, 邓霜, 等. 多模型集成学习在机械钻速预测中的新应用[J]. 计算机科学, 2021, 48(增刊1):619-622,657. doi: 10.11896/jsjkx.201000070 XU Mingze, WEI Minghui, DENG Shuang, et al. Application of multi-model ensemble learning in prediction of mechanical drilling rate[J]. Computer Science, 2021, 48(S1): 619-622,657. doi: 10.11896/jsjkx.201000070 [22] MENSA-WILMOT G, HARJADI Y, LANGDON S, et al. Drilling efficiency and rate of penetration-definitions, influencing factors, relationships and value[C]//Paper presented at the IADC/SPE Drilling Conference and Exhibition, February 2010, Louisiana, USA: SPE-128288-MS. [23] HEGDE C, GRAY K. Evaluation of coupled machine learning models for drilling optimization[J]. Journal of Natural Gas Science and Engineering, 2018, 56: 397-407. doi: 10.1016/j.jngse.2018.06.006 [24] 李谦, 曹彦伟, 朱海燕. 基于人工智能的钻速预测模型数据有效性下限分析[J]. 钻探工程, 2021, 48(3):21-30. doi: 10.12143/j.ztgc.2021.03.003 LI Qian, CAO Yanwei, ZHU Haiyan. Discussion on the lower limit of data validity for ROP predictionbased on artificial intelligence[J]. Drilling Engineering, 2021, 48(3): 21-30. doi: 10.12143/j.ztgc.2021.03.003 [25] YAVARI H, SABAH M, KHOSRAVANIAN R, et al. Application of an adaptive neuro-fuzzy inference system and mathematical rate of penetration models to predicting drilling rate[J]. Iranian Journal of Oil & Gas Science and Technology, 2018, 7(3): 73-100. doi: 10.22050/IJOGST.2018.83374.1391 [26] HEGDE C, DAIGLE H, MILLWATER H, et al. Analysis of rate of penetration(ROP)prediction in drilling using physics-based and data-driven models[J]. Jour- nal of Petroleum Science and Engineering, 2017, 159: 295-306. doi: 10.1016/j.petrol.2017.09.020 [27] 吕红燕, 冯倩. 随机森林算法研究综述[J]. 河北省科学院学报, 2019, 36(3):37-41. LV Hongyan, FENG Qian. A review of random forests algorithm[J]. Journal of the Hebei Academy of Sciences, 2019, 36(3): 37-41. [28] 刘方园, 王水花, 张煜东. 支持向量机模型与应用综述[J]. 计算机系统应用, 2018, 27(4):1-9. LIU Fangyuan, WANG Shuihua, ZHANG Yudong. Overview on models and applications of support vector machine[J]. Computer Systems & Applications, 2018, 27(4): 1-9. [29] WARREN S. MCCULLOCH,WALTER PITTS. A logical calculus of the ideas immanent in nervous activity[J]. Bulletin of Mathematical Biology, 1990, 52(1-2): 99-115. [30] FRIEDMAN J H. Greedy function approximation: A gradient boosting machine[J]. The Annals of Statistics, 2001, 29(5): 1189-1232. -