基于机器学习的页岩气井产量评价与预测

何佑伟 贺质越 汤勇 秦佳正 宋俊杰 汪勇

何佑伟,贺质越,汤勇,秦佳正,宋俊杰,汪勇. 基于机器学习的页岩气井产量评价与预测[J]. 石油钻采工艺,2021,43(4):518-524 doi:  10.13639/j.odpt.2021.04.016
引用本文: 何佑伟,贺质越,汤勇,秦佳正,宋俊杰,汪勇. 基于机器学习的页岩气井产量评价与预测[J]. 石油钻采工艺,2021,43(4):518-524 doi:  10.13639/j.odpt.2021.04.016
HE Youwei, HE Zhiyue, TANG Yong, QIN Jiazheng, SONG Junjie, WANG Yong. Shale gas well production evaluation and prediction based on machine learning[J]. Oil Drilling & Production Technology, 2021, 43(4): 518-524 doi:  10.13639/j.odpt.2021.04.016
Citation: HE Youwei, HE Zhiyue, TANG Yong, QIN Jiazheng, SONG Junjie, WANG Yong. Shale gas well production evaluation and prediction based on machine learning[J]. Oil Drilling & Production Technology, 2021, 43(4): 518-524 doi:  10.13639/j.odpt.2021.04.016

基于机器学习的页岩气井产量评价与预测

doi: 10.13639/j.odpt.2021.04.016
基金项目: 国家自然科学基金委员会青年科学基金“致密气藏多井动态缝网数值试井理论研究”(编号:52004238);中国博士后科学基金面上项目“致密气藏复杂缝网表征与水平井产气位置诊断方法研究”(编号:2019M663561)
详细信息
    作者简介:

    何佑伟(1991-),2019年毕业于中国石油大学(北京)油气田开发工程专业,获博士学位,现从事非常规油气渗流理论、CO2提高采收率与埋存、储气库、人工智能在油气领域的应用方面的教学及科研工作,讲师,硕士研究生导师。通讯地址:(610500)四川省成都市新都大道8号。电话:028-83035577。E-mail:youwei.he@swpu.edu.cn

    通讯作者:

    汤勇(1975-),现从事油气相态理论及测试、气田及凝析气田开发、注气提高采收率方面的教学及科研工作,教授,博士研究生导师。通讯地址:(610500)四川省成都市新都大道8号。电话:028-83035577。E-mail:tangyong2004@126.com

  • 中图分类号: TE377

Shale gas well production evaluation and prediction based on machine learning

  • 摘要: 页岩气井产量评价与预测对页岩气高效开发具有重要意义,现有解析模型的假设条件与实际页岩气井差异较大,数值模型计算难度大、效率低、不确定性高,导致页岩气井产量预测难度大。基于机器学习方法综合考虑地质因素与工程因素,整合页岩气开采全周期地质、钻井、压裂、生产等数据,对A页岩气藏气井产量进行了评价与预测。首先,对原始数据体进行处理,包括缺失值插补、相关性分析、异常值处理、主成分分析等,以减小数据的噪声;其次,采用聚类分析方法对页岩气井产量进行评价,研究影响A页岩气藏气井产量的主要因素;最后,应用随机森林方法预测A页岩气藏气井产量。结果表明:A区块页岩气藏中产量优、中、劣等井分别占比36.4%、37.8%、25.8%,其中压裂因素对A页岩气井产量评价结果影响最大。调参后的页岩气井产量预测结果准确度达到90%以上,预测结果较好,表明本文模型能够用于页岩气井产量预测。
  • 图  1  随机森林原理示意图

    Figure  1.  Schematic principle of random forest

    图  2  皮尔逊相关系数法分析结果

    Figure  2.  Analysis result of Pearson correlation coefficient method

    图  3  模型预测结果

    Figure  3.  Model prediction result

    表  1  A区块页岩气井产量影响因素

    Table  1.   Factors influencing the production rates of shale gas wells in A Block

    参数数值参数数值
    渗透率/
    10−6 μm2
    64.10~480.92 水平段长/m 1 500~2 200
    孔隙度/% 5.30~6.43 压裂段数 12~33
    总有机碳
    含量/%
    3.1~5.5 射孔簇数 38~125
    游离气/
    (m3 · t−1)
    1.05~4.60 改造体积/
    104 m3
    2 405.00~
    8 188.04
    吸附气/
    (m3 · t−1)
    0.98-3.03 压裂段长/m 747~2 154
    总含气量/
    (m3 · t−1)
    3.88~5.75 加砂强度/
    (t · m−3)
    0.32~2.14
    泊松比 0.20~0.25 入地液量/m3 9 760~65 063
    最小水平
    主应力/MPa
    63.22~79.90 入地砂量/t 640.60~
    3 674.25
    破裂压力/
    MPa
    65.17~99.10 砂液比/
    (t · m−3)
    0.04~0.07
    碳酸盐岩
    矿物/%
    8.50~18.45 井间干扰
    影响比例/%
    47~100
    脆性矿物/% 55.42~76.77 井间干扰
    恢复比例/%
    0~93
    黏土矿物/% 10.47~26.50 干扰距离/m 100~1 200
    石英/% 40.90~49.15
    长石/% 5.51~8.91
    脆性指数 59.95~72.34
    下载: 导出CSV

    表  2  各备选因素对应的相关因素

    Table  2.   Correlation factors corresponding to different candidate factors

    备选因素相关因素
    平均累产气 压裂段数,射孔簇数,改造体积,水平段长,
    压裂段长,入地液量,黏土矿物
    压裂段数 平均累产气,射孔簇数,改造体积,水平段长,
    压裂段长,入地液量,脆性矿物,黏土矿物
    射孔簇数 平均累产气,压裂段数,水平段长,压裂段长,
    入地液量,脆性矿物,黏土矿物
    改造体积 平均累产气,压裂段数,压裂段长,入地液量
    水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
    脆性矿物,干扰影响比例
    水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
    脆性矿物,干扰影响比例
    压裂段长 平均累产气,压裂段数,射孔簇数,改造体积,
    水平段长,入地液量,总含气量,脆性矿物,
    黏土矿物,干扰恢复比例
    入地液量 平均累产气,压裂段数,射孔簇数,改造体积,
    压裂段长,入地砂量,黏土矿物
    脆性矿物 压裂段数,射孔簇数,水平段长,压裂段长,
    黏土矿物
    黏土矿物 平均累产气,压裂段数,射孔簇数,压裂段长,
    入地液量,脆性矿物
    干扰影响比例 水平段长,干扰恢复比例
    干扰恢复比例 压裂段长,干扰影响比例
    入地砂量 入地液量
    渗透率 孔隙度
    孔隙度 渗透率
    总含气量 压裂段长
    下载: 导出CSV

    表  3  异常值筛选结果

    Table  3.   Outlier selecting result

    因素自由度异常值个数
    最小水平主应力2
    平均累产气7
    压裂段数8
    射孔簇数7
    改造体积4
    水平段长6
    压裂段长10
    入地液量7
    脆性矿物5
    黏土矿物6
    井间干扰影响比例2
    井间干扰恢复比例2
    入地砂量1
    渗透率1
    孔隙度1
    总含气量1
    下载: 导出CSV

    表  4  影响因子与备选因素对应系数矩阵

    Table  4.   Corresponding coefficient matrix of influential factors and candidate factors

    备选因素Y1Y2Y3Y4Y5
    压裂段长 0.399 0.044 0.112 −0.090 −0.183
    压裂段数 0.395 0.135 0.123 −0.083 −0.078
    射孔簇数 0.365 0.191 0.199 0.041 0.176
    入地液量 0.341 0.265 −0.182 0.253 −0.021
    水平段长 0.293 −0.249 −0.021 −0.280 −0.024
    黏土矿物 0.266 0.003 −0.132 −0.293 0.373
    脆性矿物 0.266 −0.009 0.124 −0.112 0.542
    井间干扰恢复比例 0.232 −0.344 −0.195 0.121 −0.288
    改造体积 0.230 0.323 −0.230 −0.142 −0.367
    井间干扰影响比例 −0.125 0.508 0.257 0.005 0.262
    孔隙度 0.101 −0.346 0.324 0.327 0.191
    总含气量 0.117 0.002 0.510 −0.183 −0.373
    最小水平主应力 −0.110 0.243 0.473 0.116 −0.165
    入地砂量 0.156 0.263 −0.263 0.587 0.058
    渗透率 0.157 −0.270 0.227 0.458 −0.057
    下载: 导出CSV

    表  5  聚类分析结果

    Table  5.   Cluster analysis result

    参数优等井中等井劣等井优劣差绝对值
    平均累产气0.540.19−0.671.21
    Y12.31−0.1−2.244.55
    Y20.28−0.720.230.05
    Y 3−0.260.76−0.270.01
    Y 40.24−0.760.290.05
    Y 5−0.210.8−0.350.14
    下载: 导出CSV

    表  6  调参结果

    Table  6.   Parameter adjustment result

    参数最优值
    树模型数量11
    树最大深度1
    分枝时考虑最大特征数4
    叶子节点最少样本数7
    下载: 导出CSV
  • [1] 马新华, 谢军, 雍锐, 等. 四川盆地南部龙马溪组页岩气储集层地质特征及高产控制因素[J]. 石油勘探与开发, 2020, 47(5):841-855. doi:  10.11698/PED.2020.05.01

    MA Xinhua, XIE Jun, YONG Rui, et al. Geological characteristics and high production control factors of shale gas reservoirs in Silurian Longmaxi Formation, southern Sichuan Basin, SW China[J]. Petroleum Exploration and Development, 2020, 47(5): 841-855. doi:  10.11698/PED.2020.05.01
    [2] MCCLURE M W, BABAZADEH M, SHIOZAWA S, et al. Fully coupled hydromechanical simulation of hydraulic fracturing in 3D discrete-fracture networks[J]. SPE Journal, 2016, 21(4): 1302-1320. doi:  10.2118/173354-PA
    [3] ZOBACK M D, KOHLI A H. Stimulating production from unconventional reservoirs[M]// ZOBACK M D, KOHLI A H. Unconventional reservoir geomechanics-shale gas, tight oil, and induced seismicity. Cambridge: Cambridge University Press, 2019: 231-374.
    [4] 时贤, 程远方, 常鑫, 等. 页岩气水平井段内多簇裂缝同步扩展模型建立与应用[J]. 石油钻采工艺, 2018, 40(2):247-252. doi:  10.13639/j.odpt.2018.02.018

    SHI Xian, CHENG Yuanfang, CHANG Xin, et al. Establishment and application of the model for the synchronous propagation of multi-cluster fractures in the horizontal section of shale-gas horizontal well[J]. Oil Drilling & Production Technology, 2018, 40(2): 247-252. doi:  10.13639/j.odpt.2018.02.018
    [5] WANG K, JIANG BB, LI H T, et al. Rapid and accurate evaluation of reserves in different types of shale-gas wells: production-decline analysis[J]. International Journal of Coal Geology, 2020, 218: 103359. doi:  10.1016/j.coal.2019.103359
    [6] LIANG H B, ZHANG L H, ZHAO Y L, et al. Empirical methods of decline-curve analysis for shale gas reservoirs: review, evaluation, and application[J]. Journal of Natural Gas Science and Engineering, 2020, 83: 103531. doi:  10.1016/j.jngse.2020.103531
    [7] GUINDON L. Determining interwell connectivity and reservoir complexity through fracturing pressure hits and production-interference analysis[J]. Journal of Canadian Petroleum Technology, 2015, 54(2): 88-91. doi:  10.2118/0315-088-JCPT
    [8] JACOBS T. Oil and gas producers find frac hits in shale wells a major challenge[J]. Journal of Petroleum Tech- nology, 2017, 69(4): 29-34. doi:  10.2118/0417-0029-JPT
    [9] ZHANG R H, ZHANG L H, TANG H Y, et al. A simulator for production prediction of multistage fractured horizontal well in shale gas reservoir considering complex fracture geometry[J]. Journal of Natural Gas Science and Engineering, 2019, 67: 14-29. doi:  10.1016/j.jngse.2019.04.011
    [10] 段永刚, 张泰来, 魏明强, 等. 页岩气藏“井工厂”模式下水平井裂缝分布优化[J]. 油气藏评价与开发, 2019, 9(6):78-84. doi:  10.13809/j.cnki.cn32-1825/te.2019.06.014

    DUAN Yonggang, ZHANG Tailai, WEI Mingqiang, et al. Optimization of fracture layout of fractured horizontal well in multi-well pad mode of shale gas reservoirs[J]. Reservoir Evaluation and Development, 2019, 9(6): 78-84. doi:  10.13809/j.cnki.cn32-1825/te.2019.06.014
    [11] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016: 12-13.

    ZHOU Zhihua. Machine learning[M]. Beijing: Tsinghua University Press, 2016: 12-13.
    [12] 李帅, 陈军斌, 曹毅, 等. 基于灰色关联分析法的页岩储层脆性影响因素研究[J]. 中国矿业, 2019, 28(2):169-174,180.

    LI Shuai, CHEN Junbin, CAO Yi, et al. Study on the influence factors of shale reservoir brittleness based on grey correlation analysis[J]. China Mining Magazine, 2019, 28(2): 169-174,180.
    [13] 檀朝东, 贺甲元, 周彤, 等. 基于PCA-BNN的页岩气压裂施工参数优化[J]. 西南石油大学学报(自然科学版), 2020, 42(6):56-62. doi:  10.11885/j.issn.1674-5086.2020.05.12.05

    TAN Chaodong, HE Jiayuan, ZHOU Tong, et al. A study on the optimization of fracturing operation parameters based on PCA-BNN[J]. Journal of Southwest Petroleum University(Science & Technology Edition), 2020, 42(6): 56-62. doi:  10.11885/j.issn.1674-5086.2020.05.12.05
    [14] 孙艺涵. 基于机器学习的页岩有机质含量预测方法研究[D]. 北京: 中国石油大学(北京), 2019.

    SUN Yihan. Research on prediction method of total organic carbon in shale based on machine learning[D]. Beijing: China University of Petroleum(Beijing), 2019.
    [15] 杜娟, 刘志刚, 宋考平, 等. 基于卷积神经网络的抽油机故障诊断[J]. 电子科技大学学报, 2020, 49(5):751-757. doi:  10.12178/1001-0548.2019205

    DU Juan, LIU Zhigang, SONG Kaoping, et al. Fault diagnosis of pumping unit based on convolutional neural network[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(5): 751-757. doi:  10.12178/1001-0548.2019205
    [16] 纪磊, 李菊花, 肖佳林. 随机森林算法在页岩气田多段压裂改造中的应用[J]. 大庆石油地质与开发, 2020, 39(6):168-174. doi:  10.19597/J.ISSN.1000-3754.201908015

    JI Lei, LI Juhua, XIAO Jialin. Application of random forest algorithm in the multistage fracturing stimulation of shale gas field[J]. Petroleum Geology & Oilfield Development in Daqing, 2020, 39(6): 168-174. doi:  10.19597/J.ISSN.1000-3754.201908015
    [17] 祝元宠, 咸玉席, 李清宇, 等. 基于大数据的页岩气产能预测[J]. 油气井测试, 2019, 28(1):1-6. doi:  10.19680/j.cnki.1004-4388.2019.01.001

    ZHU Yuanchong, XIAN Yuxi, LI Qingyu, et al. Shale gas productivity forecast based on big data[J]. Well Testing, 2019, 28(1): 1-6. doi:  10.19680/j.cnki.1004-4388.2019.01.001
    [18] 刘巍, 刘威, 谷建伟. 基于机器学习方法的油井日产油量预测[J]. 石油钻采工艺, 2020, 42(1):70-75. doi:  10.13639/j.odpt.2020.01.012

    LIU Wei, LIU Wei, GU Jianwei. Oil production prediction based on a machine learning method[J]. Oil Drilling & Production Technology, 2020, 42(1): 70-75. doi:  10.13639/j.odpt.2020.01.012
    [19] 辛欣, 王海彬, 罗建男, 等. 基于机器学习方法的海洋天然气水合物水平井降压开采模拟—优化耦合模型[J]. 天然气工业, 2020, 40(8):149-158. doi:  10.3787/j.issn.1000-0976.2020.08.012

    XIN Xin, WANG Haibin, LUO Jiannan, et al. Simulation-optimization coupling model for the depressurization production of marine natural gas hydrate in horizontal wells based on machine learning method[J]. Natural Gas Industry, 2020, 40(8): 149-158. doi:  10.3787/j.issn.1000-0976.2020.08.012
    [20] 朱庆忠, 胡秋嘉, 杜海为, 等. 基于随机森林算法的煤层气直井产气量模型[J]. 煤炭学报, 2020, 45(8):2846-2855. doi:  10.13225/j.cnki.jccs.2020.0205

    ZHU Qingzhong, HU Qiujia, DU Haiwei, et al. A gas production model of vertical coalbed methane well based on random forest algorithm[J]. Journal of China Coal Society, 2020, 45(8): 2846-2855. doi:  10.13225/j.cnki.jccs.2020.0205
    [21] GONG X L, GONZALEZ R, MCVAY D A, et al. Bayesian probabilistic decline-curve analysis reliably quantifies uncertainty in shale-well-production forecasts[J]. SPE Journal, 2014, 19(6): 1047-1057. doi:  10.2118/147588-PA
    [22] YU W, TAN X S, ZUO L H, et al. A new probabilistic approach for uncertainty quantification in well performance of shale gas reservoirs[J]. SPE Journal, 2016, 21(6): 2038-2048. doi:  10.2118/183651-PA
    [23] 马文礼, 李治平, 孙玉平, 等. 基于机器学习的页岩气产能非确定性预测方法研究[J]. 特种油气藏, 2019, 26(2):101-105. doi:  10.3969/j.issn.1006-6535.2019.02.018

    MA Wenli, LI Zhiping, SUN Yuping, et al. Non-deterministic shale gas productivity forecast based on machine learning[J]. Special Oil & Gas Reservoirs, 2019, 26(2): 101-105. doi:  10.3969/j.issn.1006-6535.2019.02.018
    [24] 李菊花, 陈晨, 肖佳林. 基于随机森林算法的页岩气多段压裂井产量预测[J]. 长江大学学报(自然科学版), 2020, 17(4):34-38,7. doi:  10.16772/j.cnki.1673-1409.2020.04.006

    LI Juhua, CHEN Chen, XIAO Jialin. Yield prediction of shale gas multi-stage fracturing wells based on random forest algorithm[J]. Journal of Yangtze University (Natural Science Edition), 2020, 17(4): 34-38,7. doi:  10.16772/j.cnki.1673-1409.2020.04.006
    [25] 严子铭, 王涛, 柳占立, 等. 基于机器学习的页岩气采收率预测方法[J]. 固体力学学报, 2021, 42(3):221-232. doi:  10.19636/j.cnki.cjsm42-1250/o3.2021.027

    YAN Ziming, WANG Tao, LIU Zhanli, et al. Machine-learning-based prediction methods on shale gas recovery[J]. Chinese Journal of Solid Mechanics, 2021, 42(3): 221-232. doi:  10.19636/j.cnki.cjsm42-1250/o3.2021.027
    [26] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. doi:  10.1023/A:1010933404324
    [27] 秦璇. 随机森林算法的改进及应用[D]. 兰州: 兰州交通大学, 2020.

    QIN Xuan. Improvement and application of randome forest algorithm[D]. Lanzhou: Lanzhou Jiaotong University, 2020.
    [28] SARDINHA C, PETR C, LehmannJ, et al. Determining interwell connectivity and reservoir complexity through frac pressure hits and production interference analysis[C]//SPE/CSUR Unconventional Resources Conference-Canada, Calgary, Alberta, Canada, 2014: SPE-171628-MS. DOI:  10.2118/171628-MS.
  • [1] 王娟, 梅启亮, 邹永玲, 蔡亮, 苏建华, 田榆杰, 黄瑞.  基于多参数时间序列及粒子群优化算法的油藏产量动态建模预测方法 . 石油钻采工艺, 2023, 45(2): 190-196. doi: 10.13639/j.odpt.2023.02.010
    [2] 阎续, 孙敬, 刘德华.  页岩气井返排规律实验与微观力学机制分析 . 石油钻采工艺, 2022, 44(4): 461-467. doi: 10.13639/j.odpt.2022.04.009
    [3] 宋保建, 王若浩, 马良宇, 魏振国, 贾喻博, 刘慧卿.  基于机器学习的稠油油藏注蒸汽过程中汽窜识别研究 . 石油钻采工艺, 2022, 44(6): 777-783. doi: 10.13639/j.odpt.2022.06.018
    [4] 杨耀忠, 邴绍强, 马承杰, 于金彪, 王相, 李秉超, 景瑞林, 孙召龙.  基于集成学习的油藏井筒一体化智能诊断模型 . 石油钻采工艺, 2022, 44(3): 383-389. doi: 10.13639/j.odpt.2022.03.017
    [5] 窦宏恩, 张蕾, 米兰, 彭翼, 王洪亮.  人工智能在全球油气工业领域的应用现状与前景展望 . 石油钻采工艺, 2021, 43(4): 405-419, 441. doi: 10.13639/j.odpt.2021.04.001
    [6] 薛亮, 顾少华, 王嘉宝, 刘月田, 涂彬.  基于粒子群优化和长短期记忆神经网络的气井生产动态预测 . 石油钻采工艺, 2021, 43(4): 525-531. doi: 10.13639/j.odpt.2021.04.017
    [7] 夏海帮, 包凯, 李成龙.  南川页岩气田绿色开发技术优化与实践 . 石油钻采工艺, 2021, 43(1): 54-58. doi: 10.13639/j.odpt.2021.01.009
    [8] 杜支文, 高吉宏, 蒋婷婷, 吴海红, 王超, 王泓波, 赵旭.  米脂气田盒8段优势储层研究及钻井有利区域评价 . 石油钻采工艺, 2021, 43(6): 719-726. doi: 10.13639/j.odpt.2021.06.005
    [9] 杨军征, 冯钢, 王青华, 邹洪岚, 马丹.  深度学习的电泵井产液量动态预测模型 . 石油钻采工艺, 2021, 43(4): 489-496. doi: 10.13639/j.odpt.2021.04.012
    [10] 刘巍, 刘威, 谷建伟.  基于机器学习方法的油井日产油量预测 . 石油钻采工艺, 2020, 42(1): 70-75. doi: 10.13639/j.odpt.2020.01.012
    [11] 赵振峰, 白晓虎, 陈强, 苏玉亮, 范理尧, 王文东.  基于模糊集合理论的体积压裂水平井产量预测方法 . 石油钻采工艺, 2019, 41(4): 521-528. doi: 10.13639/j.odpt.2019.04.019
    [12] 陈雷, 陈会年, 张林海, 刘广海, 陶谦, 刘仍光.  JY页岩气田水平井预防环空带压固井技术 . 石油钻采工艺, 2019, 41(2): 152-159. doi: 10.13639/j.odpt.2019.02.006
    [13] 李凡华, 乔磊, 田中兰, 孙清华, 杜卫强, 付盼.  威远页岩气水平井压裂套变原因分析 . 石油钻采工艺, 2019, 41(6): 734-738. doi: 10.13639/j.odpt.2019.06.010
    [14] 李亚南, 于占淼.  涪陵页岩气田二期水平井钻井防碰绕障技术 . 石油钻采工艺, 2017, 39(3): 303-306. doi: 10.13639/j.odpt.2017.03.009
    [15] 郭小哲, 周长沙.  基于滑脱的页岩气藏压裂水平井渗流模型及产能预测 . 石油钻采工艺, 2015, 37(3): 61-65. doi: 10.13639/j.odpt.2015.03.014
    [16] 李彦尊, 李相方, 徐敏, 武文涛, 张晓舟.  页岩气藏产量递减预测模型研究及应用 . 石油钻采工艺, 2015, 37(6): 74-77. doi: 10.13639/j.odpt.2015.06.018
    [17] 刘蜀知, 孙艾茵, 李达, 关欣, 孟凡龙.  苏里格低渗气田压裂井拟稳态期产量预测方法 . 石油钻采工艺, 2014, 36(6): 65-68. doi: 10.13639/j.odpt.2014.06.016
    [18] 徐波, 薛中天, 韩继勇.  用灰色系统模型预测油井产量 . 石油钻采工艺, 2001, 23(3): 48-49,85. doi: 10.3969/j.issn.1000-7393.2001.03.016
    [19] 苗和平, 王鸿勋.  水平井压后产量预测及裂缝数优选 . 石油钻采工艺, 1992, 14(6): 51-56. doi: 10.3969/j.issn.1000-7393.1992.06.009
    [20] 马福军, 李淑芬, 曹秀芝.  残差修正模型在原油年产量预测中的应用 . 石油钻采工艺, 1992, 14(5): 40-47. doi: 10.3969/j.issn.1000-7393.1992.05.008
  • 加载中
图(3) / 表 (6)
计量
  • 文章访问数:  3
  • HTML全文浏览量:  261
  • PDF下载量:  72
  • 被引次数: 0
出版历程
  • 修回日期:  2021-05-29
  • 刊出日期:  2021-07-31

基于机器学习的页岩气井产量评价与预测

doi: 10.13639/j.odpt.2021.04.016
    基金项目:  国家自然科学基金委员会青年科学基金“致密气藏多井动态缝网数值试井理论研究”(编号:52004238);中国博士后科学基金面上项目“致密气藏复杂缝网表征与水平井产气位置诊断方法研究”(编号:2019M663561)
    作者简介:

    何佑伟(1991-),2019年毕业于中国石油大学(北京)油气田开发工程专业,获博士学位,现从事非常规油气渗流理论、CO2提高采收率与埋存、储气库、人工智能在油气领域的应用方面的教学及科研工作,讲师,硕士研究生导师。通讯地址:(610500)四川省成都市新都大道8号。电话:028-83035577。E-mail:youwei.he@swpu.edu.cn

    通讯作者: 汤勇(1975-),现从事油气相态理论及测试、气田及凝析气田开发、注气提高采收率方面的教学及科研工作,教授,博士研究生导师。通讯地址:(610500)四川省成都市新都大道8号。电话:028-83035577。E-mail:tangyong2004@126.com
  • 中图分类号: TE377

摘要: 页岩气井产量评价与预测对页岩气高效开发具有重要意义,现有解析模型的假设条件与实际页岩气井差异较大,数值模型计算难度大、效率低、不确定性高,导致页岩气井产量预测难度大。基于机器学习方法综合考虑地质因素与工程因素,整合页岩气开采全周期地质、钻井、压裂、生产等数据,对A页岩气藏气井产量进行了评价与预测。首先,对原始数据体进行处理,包括缺失值插补、相关性分析、异常值处理、主成分分析等,以减小数据的噪声;其次,采用聚类分析方法对页岩气井产量进行评价,研究影响A页岩气藏气井产量的主要因素;最后,应用随机森林方法预测A页岩气藏气井产量。结果表明:A区块页岩气藏中产量优、中、劣等井分别占比36.4%、37.8%、25.8%,其中压裂因素对A页岩气井产量评价结果影响最大。调参后的页岩气井产量预测结果准确度达到90%以上,预测结果较好,表明本文模型能够用于页岩气井产量预测。

English Abstract

何佑伟,贺质越,汤勇,秦佳正,宋俊杰,汪勇. 基于机器学习的页岩气井产量评价与预测[J]. 石油钻采工艺,2021,43(4):518-524 doi:  10.13639/j.odpt.2021.04.016
引用本文: 何佑伟,贺质越,汤勇,秦佳正,宋俊杰,汪勇. 基于机器学习的页岩气井产量评价与预测[J]. 石油钻采工艺,2021,43(4):518-524 doi:  10.13639/j.odpt.2021.04.016
HE Youwei, HE Zhiyue, TANG Yong, QIN Jiazheng, SONG Junjie, WANG Yong. Shale gas well production evaluation and prediction based on machine learning[J]. Oil Drilling & Production Technology, 2021, 43(4): 518-524 doi:  10.13639/j.odpt.2021.04.016
Citation: HE Youwei, HE Zhiyue, TANG Yong, QIN Jiazheng, SONG Junjie, WANG Yong. Shale gas well production evaluation and prediction based on machine learning[J]. Oil Drilling & Production Technology, 2021, 43(4): 518-524 doi:  10.13639/j.odpt.2021.04.016
    • 常规储层天然气产量已不能满足市场需求,全球页岩气藏已成为非常规天然气勘探开发的重要领域。中国页岩气资源量丰富,在国家产业政策的指导和支持下,该产业快速发展。截至2020年2月,长宁、威远和昭通页岩气示范区块已累计提交探明储量10 610×108 m3,累产页岩气超200×108 m3[1]。加大页岩气开发和利用对保障能源安全,改善能源结构,减少环境污染,建设清洁低碳、安全高效的能源体系具有十分重要的战略意义。

      页岩气藏孔隙度和渗透率极低,单井一般无自然产能或自然产能低于工业气流下限,需要采用水平井和水力压裂改造技术进行开发,形成天然裂缝和压裂裂缝相互连通的复杂裂缝网络,提高气体在储层中的渗流能力[2-4]。但压裂后缝网关系复杂、裂缝动态变化、多井平台中井间压窜现象显著、气-水-压裂液多相流动规律复杂,导致页岩气井产量难以预测,致使后续开发方案设计与调整缺乏科学依据。高效、准确地评价与预测页岩气井产量对于提高页岩气资源开发效果至关重要。

      国内外学者采用经验公式、解析方法及数值方法开展了大量页岩气产量预测方面的研究。其中,经验公式及解析模型难以考虑页岩气藏复杂渗流特征,不同模型的适用条件及适用阶段都各有不同,导致预测结果与实际相差较大[5-6];基于数值模型的产量预测方法对实际储层特征进行了简化,包括对复杂动态缝网刻画不够精确、未考虑井组压窜干扰特征等[7-10],且页岩气井组缝网数值模型计算量较大,历史拟合难度大,产量预测效率较低,结果不确定性高,故现场推广性一般。因此,需借助新方法开展页岩气井产量预测研究。

      机器学习是一种多领域交叉学科,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题[11],包括在石油与天然气领域[12-18]。刘巍等[19]根据实际油藏静态资料和开发动态资料,使用机器学习方法实现油井日产油量预测;辛欣等[20]基于机器学习方法构建水合物降压开采传热—流动—力学数值模拟模型及可以替代数值模拟模型的机器学习模型,找到了累计产气量最优值与地层稳定性的关系。在页岩气产能预测方面,Gong等[21]及Yu等[22]针对页岩气产量预测中的不确定性问题进行了研究;马文礼等[23]提出了一种基于机器学习的页岩气产能非确定性预测方法;李菊花等[24]通过对储层物性和压裂施工参数分析,引入随机森林算法对页岩气压裂水平井产量进行预测,并指出测深、垂深、延伸压力、脆性指数、密度测井值和总液量是多段压裂井产量的主要影响因素;严子铭等[25]基于涪陵页岩气藏水平井的现场数据,分别采用深度神经网络、支持向量回归以及极限梯度爬升等3种机器学习方法,建立了从储层和施工参数到采收率的预测模型,分析了各类模型的优缺点,以及相关参数的重要性。目前,基于机器学习方法的页岩气井产量预测多以部分因素(地质因素或压裂因素等)为基础进行研究,指标体系不完善,结果可靠性有待进一步验证。

      鉴于产量评价及预测需要全面考虑页岩气地质、钻井、压裂、生产等多方面因素,并精细处理地质及工程数据,笔者利用机器学习方法进行页岩气井产量评价及预测研究。首先对初始数据进行缺失值分析,利用多重插补法对缺失值进行插补。之后运用皮尔逊相关系数法对各类数据进行相关性分析,利用分析结果对数据进行异常值处理。由于因素数量较多,使用主成分分析对其进行降维处理,基于最终降维的结果进行页岩气井产量的聚类分析,并划分A区块页岩气井产量等级,最后采用随机森林方法对页岩气井产量进行预测。

    • 加利福尼亚数学教授Breiman于2001年完善并推广了随机森林这一经典机器学习模型[26],其所拥有的出色性能以及解决问题领域的宽泛性已经得到了学术界的广泛认可。随机森林作为一个集成评估器,其基评估器是决策树[27]。对于决策树模型,其回归、分类的能力有限,存在过拟合风险[28],数据微小波动可能导致结果出现较大偏差,因此使用集成算法(随机森林)来解决上述问题。集成算法综合考虑多评估器建模结果,以此获取相较于单评估器更好的回归或分类表现。随机森林是由多个决策树组成的集成评估器,其原理见图1

      图  1  随机森林原理示意图

      Figure 1.  Schematic principle of random forest

    • 首先进行数据处理,使用的数据类型全为连续型,数据质量需要进行相关性分析。观察原始数据发现缺失值较多,需要插补。插补过后需要进行异常值分析,处理异常值。此次所用数据的特征较多(表1),若将全部特征放入模型进行训练,将大幅增加模型复杂程度及计算量,因此通过主成分分析将可能存在相关性的特征变为线性不相关的特征,来对数据进行降维以提高模型计算效率,转换后的特征称为主成分。

      表 1  A区块页岩气井产量影响因素

      Table 1.  Factors influencing the production rates of shale gas wells in A Block

      参数数值参数数值
      渗透率/
      10−6 μm2
      64.10~480.92 水平段长/m 1 500~2 200
      孔隙度/% 5.30~6.43 压裂段数 12~33
      总有机碳
      含量/%
      3.1~5.5 射孔簇数 38~125
      游离气/
      (m3 · t−1)
      1.05~4.60 改造体积/
      104 m3
      2 405.00~
      8 188.04
      吸附气/
      (m3 · t−1)
      0.98-3.03 压裂段长/m 747~2 154
      总含气量/
      (m3 · t−1)
      3.88~5.75 加砂强度/
      (t · m−3)
      0.32~2.14
      泊松比 0.20~0.25 入地液量/m3 9 760~65 063
      最小水平
      主应力/MPa
      63.22~79.90 入地砂量/t 640.60~
      3 674.25
      破裂压力/
      MPa
      65.17~99.10 砂液比/
      (t · m−3)
      0.04~0.07
      碳酸盐岩
      矿物/%
      8.50~18.45 井间干扰
      影响比例/%
      47~100
      脆性矿物/% 55.42~76.77 井间干扰
      恢复比例/%
      0~93
      黏土矿物/% 10.47~26.50 干扰距离/m 100~1 200
      石英/% 40.90~49.15
      长石/% 5.51~8.91
      脆性指数 59.95~72.34
    • 对原始数据进行分析,结果表明缺失数据高达34.61%,因此不建议采用众数与平均数替换方法插补缺失值。笔者采用多重插补法对缺失值进行插补:基于除缺失值外的变量建立线性模型,以此预测要填补的数据。对插补后的数据进行分析,未出现明显异常值,因此多重插补结果可信度较高,但仍需进一步进行异常值检测来检查插补数据的质量。

    • 现场数据量大且复杂程度高,因此存在一定的误差。明显异常的数据(如数量级异常)易于分辨,而对于不明显的异常,人工筛选效果较差。在异常值处理中可以选用的方法有很多,例如:箱型法、马氏距离法、库克距离法等。最简单的是箱型法,其可判断单个因素中的异常值,但对于多个因素相关性较强的情况而言,箱型法得出结论较片面。在进行异常值判断时,需找到不同因素彼此之间的关联:对于独立性较强的因素(如主压裂液量)采用箱型法筛选异常值,对于与其他因素相关性较高的因素(如返排率)采用马氏距离法来筛选异常值。

      在异常值处理后,采用皮尔逊相关系数法对连续数据进行分析(图2),结果表明大多数变量间的相关性是正常的(如压裂段数、射孔簇数及改造体积等),部分相关性存在异常,例如:总有机碳含量、脆性指数与平均累产气量为负相关,表明该特征对应的数据不合理,因此需要进一步处理数据,删除相关性异常的因素。

      图  2  皮尔逊相关系数法分析结果

      Figure 2.  Analysis result of Pearson correlation coefficient method

      将与平均累产气相关性较弱的因素剔除,在确保数据量充足的前提下提高计算效率,筛选后的与累产气相关的备选因素剩余15个:压裂段数、射孔簇数、改造体积、水平段长、压裂段长、入地液量、入地砂量、渗透率、孔隙度、总含气量、最小水平主应力、脆性矿物、黏土矿物、井间干扰影响比例、井间干扰恢复比例。分别确定上述15个因素对应的相关因素,结果见表2

      表 2  各备选因素对应的相关因素

      Table 2.  Correlation factors corresponding to different candidate factors

      备选因素相关因素
      平均累产气 压裂段数,射孔簇数,改造体积,水平段长,
      压裂段长,入地液量,黏土矿物
      压裂段数 平均累产气,射孔簇数,改造体积,水平段长,
      压裂段长,入地液量,脆性矿物,黏土矿物
      射孔簇数 平均累产气,压裂段数,水平段长,压裂段长,
      入地液量,脆性矿物,黏土矿物
      改造体积 平均累产气,压裂段数,压裂段长,入地液量
      水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
      脆性矿物,干扰影响比例
      水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
      脆性矿物,干扰影响比例
      压裂段长 平均累产气,压裂段数,射孔簇数,改造体积,
      水平段长,入地液量,总含气量,脆性矿物,
      黏土矿物,干扰恢复比例
      入地液量 平均累产气,压裂段数,射孔簇数,改造体积,
      压裂段长,入地砂量,黏土矿物
      脆性矿物 压裂段数,射孔簇数,水平段长,压裂段长,
      黏土矿物
      黏土矿物 平均累产气,压裂段数,射孔簇数,压裂段长,
      入地液量,脆性矿物
      干扰影响比例 水平段长,干扰恢复比例
      干扰恢复比例 压裂段长,干扰影响比例
      入地砂量 入地液量
      渗透率 孔隙度
      孔隙度 渗透率
      总含气量 压裂段长

      除最小水平主应力外,其余备选因素皆有与其相关的因素,因此选用箱型法筛选最小水平主应力异常值,马氏距离法筛选其余因素异常值,筛选结果见表3。除最小水平主应力存在2个异常值,其余插补后的数据均未见异常值。并且最小水平主应力异常值数量很少,可删除。

      表 3  异常值筛选结果

      Table 3.  Outlier selecting result

      因素自由度异常值个数
      最小水平主应力2
      平均累产气7
      压裂段数8
      射孔簇数7
      改造体积4
      水平段长6
      压裂段长10
      入地液量7
      脆性矿物5
      黏土矿物6
      井间干扰影响比例2
      井间干扰恢复比例2
      入地砂量1
      渗透率1
      孔隙度1
      总含气量1
    • 在聚类分析时若使用全部因素进行分析,那么数据噪声过大,若直接删除与累产量相关性较差的因素,可能损失部分有用信息。针对异常值处理及相关性分析后得到的15个备用因素进行主成分分析,对数据进行降维,以此提取得到由备用因素组合形成的影响因子,最终选定其中5个特征值大于1的变量。计算得到影响因子与备选因素之间的相关性矩阵见表4

      表 4  影响因子与备选因素对应系数矩阵

      Table 4.  Corresponding coefficient matrix of influential factors and candidate factors

      备选因素Y1Y2Y3Y4Y5
      压裂段长 0.399 0.044 0.112 −0.090 −0.183
      压裂段数 0.395 0.135 0.123 −0.083 −0.078
      射孔簇数 0.365 0.191 0.199 0.041 0.176
      入地液量 0.341 0.265 −0.182 0.253 −0.021
      水平段长 0.293 −0.249 −0.021 −0.280 −0.024
      黏土矿物 0.266 0.003 −0.132 −0.293 0.373
      脆性矿物 0.266 −0.009 0.124 −0.112 0.542
      井间干扰恢复比例 0.232 −0.344 −0.195 0.121 −0.288
      改造体积 0.230 0.323 −0.230 −0.142 −0.367
      井间干扰影响比例 −0.125 0.508 0.257 0.005 0.262
      孔隙度 0.101 −0.346 0.324 0.327 0.191
      总含气量 0.117 0.002 0.510 −0.183 −0.373
      最小水平主应力 −0.110 0.243 0.473 0.116 −0.165
      入地砂量 0.156 0.263 −0.263 0.587 0.058
      渗透率 0.157 −0.270 0.227 0.458 −0.057

      利用k均值聚类法对样本进行分析(表5),优等井、中等井、劣等井分别占比36.4%、37.8%、25.8%,其中优等井、劣等井的聚类中心差值绝对值最大的为Y1影响因子,因此其对A区块页岩气藏产量评价结果影响最大,Y1影响因子的主控因素为压裂因素(压裂段长、压裂段数、射孔簇数、入地液量),在压裂因素中占比最大的为压裂段长。

      表 5  聚类分析结果

      Table 5.  Cluster analysis result

      参数优等井中等井劣等井优劣差绝对值
      平均累产气0.540.19−0.671.21
      Y12.31−0.1−2.244.55
      Y20.28−0.720.230.05
      Y 3−0.260.76−0.270.01
      Y 40.24−0.760.290.05
      Y 5−0.210.8−0.350.14
    • 基于Python语言,采用随机森林算法对A区块页岩气井进行产量预测。由于不同评价指标往往具有不同量纲,各指标之间可比性较差,因此首先将数据归一化,以进行综合对比评价。归一化使预处理数据被限定在[0,1]之内,让数量级较小的指标也具有“发言权”。随后确定数据标签及特征(标签为平均累产气,特征为其余14个因素),并随机划分训练集和测试集,以避免偶然性。最后将随机森林回归器实例化,通过交叉验证观察模型稳定性:将数据划分为10份,依次使用其中1份作为测试集,其他作为训练集,通过多次计算检验模型精确度及泛化性,交叉验证得到均方误差(MSE)为0.083 5。为进一步检查模型的准确度,随机生成测试集放入模型进行预测,4口井预测结果的均方误差(MSE)为0.014 2,预测准确率为89.32%。

      对随机森林模型调参,首先调整最优随机状态值,绘制学习曲线,选出最优随机状态值为30。固定随机状态值,针对树模型数量绘制学习曲线,寻找最优树模型数量。以此类推,遍历各变量寻找最优参数,包括:树模型数量、树最大深度、分枝时考虑最大特征数、叶子节点最少样本数,中间节点分枝所需最小样本数。结果表明在对中间节点分枝所需最小样本数进行调参时,模型准确度不增反降,认为此时模型达到最优,此时调参后模型交叉验证结果MSE为0.055 7,最优参数见表6

      表 6  调参结果

      Table 6.  Parameter adjustment result

      参数最优值
      树模型数量11
      树最大深度1
      分枝时考虑最大特征数4
      叶子节点最少样本数7

      调参后模型相较于未调参模型MSE下降了0.027 8,模型准确率提高了33.29%,可见模型调参效果明显。随机选取的4口井预测结果准确率达98.05%(图3),表明本文建立的基于随机森林的页岩气井产量预测模型具有较高应用价值。

      图  3  模型预测结果

      Figure 3.  Model prediction result

    • (1)提出了一种基于机器学习的页岩气井产量评价与预测方法。运用了较完整的数据处理方法,使用多重插补法对缺失数据进行插补,应用相关性分析得到平均累积产气量以及其他因素之间的相关性,筛选出15个备选因素。

      (2)针对异常值处理及相关性分析后得到的15个备选因素进行主成分分析,对数据进行降维,最终采用主成分分析法对特征进行降维,以此在保证数据不失真的前提下获取更高的计算效率。

      (3)采用聚类分析方法对A区块页岩气井产量进行了评价,划分出优等井、中等井、劣等井3个等级,并对每口页岩气井进行等级划分。结果表明压裂因素是对A区块页岩气井产量影响最大的因素,其中压裂段长起主要作用,因此为提高产量未来在压裂过程中可着重对压裂段长进行优化设计。

      (4)应用随机森林方法对A区块页岩气井进行产量预测,逐步对模型进行调参,得到最优模型,并运用最优模型进行产能预测。结果显示调参后的模型相较于未调参模型均方误差MSE下降了0.027 8,准确率提高33.29%,可见模型调参效果明显,预测准确率达90%以上,证明本文建立的预测模型具有较强实用性。

参考文献 (28)

目录

    /

    返回文章
    返回