-
常规储层天然气产量已不能满足市场需求,全球页岩气藏已成为非常规天然气勘探开发的重要领域。中国页岩气资源量丰富,在国家产业政策的指导和支持下,该产业快速发展。截至2020年2月,长宁、威远和昭通页岩气示范区块已累计提交探明储量10 610×108 m3,累产页岩气超200×108 m3[1]。加大页岩气开发和利用对保障能源安全,改善能源结构,减少环境污染,建设清洁低碳、安全高效的能源体系具有十分重要的战略意义。
页岩气藏孔隙度和渗透率极低,单井一般无自然产能或自然产能低于工业气流下限,需要采用水平井和水力压裂改造技术进行开发,形成天然裂缝和压裂裂缝相互连通的复杂裂缝网络,提高气体在储层中的渗流能力[2-4]。但压裂后缝网关系复杂、裂缝动态变化、多井平台中井间压窜现象显著、气-水-压裂液多相流动规律复杂,导致页岩气井产量难以预测,致使后续开发方案设计与调整缺乏科学依据。高效、准确地评价与预测页岩气井产量对于提高页岩气资源开发效果至关重要。
国内外学者采用经验公式、解析方法及数值方法开展了大量页岩气产量预测方面的研究。其中,经验公式及解析模型难以考虑页岩气藏复杂渗流特征,不同模型的适用条件及适用阶段都各有不同,导致预测结果与实际相差较大[5-6];基于数值模型的产量预测方法对实际储层特征进行了简化,包括对复杂动态缝网刻画不够精确、未考虑井组压窜干扰特征等[7-10],且页岩气井组缝网数值模型计算量较大,历史拟合难度大,产量预测效率较低,结果不确定性高,故现场推广性一般。因此,需借助新方法开展页岩气井产量预测研究。
机器学习是一种多领域交叉学科,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题[11],包括在石油与天然气领域[12-18]。刘巍等[19]根据实际油藏静态资料和开发动态资料,使用机器学习方法实现油井日产油量预测;辛欣等[20]基于机器学习方法构建水合物降压开采传热—流动—力学数值模拟模型及可以替代数值模拟模型的机器学习模型,找到了累计产气量最优值与地层稳定性的关系。在页岩气产能预测方面,Gong等[21]及Yu等[22]针对页岩气产量预测中的不确定性问题进行了研究;马文礼等[23]提出了一种基于机器学习的页岩气产能非确定性预测方法;李菊花等[24]通过对储层物性和压裂施工参数分析,引入随机森林算法对页岩气压裂水平井产量进行预测,并指出测深、垂深、延伸压力、脆性指数、密度测井值和总液量是多段压裂井产量的主要影响因素;严子铭等[25]基于涪陵页岩气藏水平井的现场数据,分别采用深度神经网络、支持向量回归以及极限梯度爬升等3种机器学习方法,建立了从储层和施工参数到采收率的预测模型,分析了各类模型的优缺点,以及相关参数的重要性。目前,基于机器学习方法的页岩气井产量预测多以部分因素(地质因素或压裂因素等)为基础进行研究,指标体系不完善,结果可靠性有待进一步验证。
鉴于产量评价及预测需要全面考虑页岩气地质、钻井、压裂、生产等多方面因素,并精细处理地质及工程数据,笔者利用机器学习方法进行页岩气井产量评价及预测研究。首先对初始数据进行缺失值分析,利用多重插补法对缺失值进行插补。之后运用皮尔逊相关系数法对各类数据进行相关性分析,利用分析结果对数据进行异常值处理。由于因素数量较多,使用主成分分析对其进行降维处理,基于最终降维的结果进行页岩气井产量的聚类分析,并划分A区块页岩气井产量等级,最后采用随机森林方法对页岩气井产量进行预测。
-
首先进行数据处理,使用的数据类型全为连续型,数据质量需要进行相关性分析。观察原始数据发现缺失值较多,需要插补。插补过后需要进行异常值分析,处理异常值。此次所用数据的特征较多(表1),若将全部特征放入模型进行训练,将大幅增加模型复杂程度及计算量,因此通过主成分分析将可能存在相关性的特征变为线性不相关的特征,来对数据进行降维以提高模型计算效率,转换后的特征称为主成分。
表 1 A区块页岩气井产量影响因素
Table 1. Factors influencing the production rates of shale gas wells in A Block
参数 数值 参数 数值 渗透率/
10−6 μm264.10~480.92 水平段长/m 1 500~2 200 孔隙度/% 5.30~6.43 压裂段数 12~33 总有机碳
含量/%3.1~5.5 射孔簇数 38~125 游离气/
(m3 · t−1)1.05~4.60 改造体积/
104 m32 405.00~
8 188.04吸附气/
(m3 · t−1)0.98-3.03 压裂段长/m 747~2 154 总含气量/
(m3 · t−1)3.88~5.75 加砂强度/
(t · m−3)0.32~2.14 泊松比 0.20~0.25 入地液量/m3 9 760~65 063 最小水平
主应力/MPa63.22~79.90 入地砂量/t 640.60~
3 674.25破裂压力/
MPa65.17~99.10 砂液比/
(t · m−3)0.04~0.07 碳酸盐岩
矿物/%8.50~18.45 井间干扰
影响比例/%47~100 脆性矿物/% 55.42~76.77 井间干扰
恢复比例/%0~93 黏土矿物/% 10.47~26.50 干扰距离/m 100~1 200 石英/% 40.90~49.15 长石/% 5.51~8.91 脆性指数 59.95~72.34 -
对原始数据进行分析,结果表明缺失数据高达34.61%,因此不建议采用众数与平均数替换方法插补缺失值。笔者采用多重插补法对缺失值进行插补:基于除缺失值外的变量建立线性模型,以此预测要填补的数据。对插补后的数据进行分析,未出现明显异常值,因此多重插补结果可信度较高,但仍需进一步进行异常值检测来检查插补数据的质量。
-
现场数据量大且复杂程度高,因此存在一定的误差。明显异常的数据(如数量级异常)易于分辨,而对于不明显的异常,人工筛选效果较差。在异常值处理中可以选用的方法有很多,例如:箱型法、马氏距离法、库克距离法等。最简单的是箱型法,其可判断单个因素中的异常值,但对于多个因素相关性较强的情况而言,箱型法得出结论较片面。在进行异常值判断时,需找到不同因素彼此之间的关联:对于独立性较强的因素(如主压裂液量)采用箱型法筛选异常值,对于与其他因素相关性较高的因素(如返排率)采用马氏距离法来筛选异常值。
在异常值处理后,采用皮尔逊相关系数法对连续数据进行分析(图2),结果表明大多数变量间的相关性是正常的(如压裂段数、射孔簇数及改造体积等),部分相关性存在异常,例如:总有机碳含量、脆性指数与平均累产气量为负相关,表明该特征对应的数据不合理,因此需要进一步处理数据,删除相关性异常的因素。
将与平均累产气相关性较弱的因素剔除,在确保数据量充足的前提下提高计算效率,筛选后的与累产气相关的备选因素剩余15个:压裂段数、射孔簇数、改造体积、水平段长、压裂段长、入地液量、入地砂量、渗透率、孔隙度、总含气量、最小水平主应力、脆性矿物、黏土矿物、井间干扰影响比例、井间干扰恢复比例。分别确定上述15个因素对应的相关因素,结果见表2。
表 2 各备选因素对应的相关因素
Table 2. Correlation factors corresponding to different candidate factors
备选因素 相关因素 平均累产气 压裂段数,射孔簇数,改造体积,水平段长,
压裂段长,入地液量,黏土矿物压裂段数 平均累产气,射孔簇数,改造体积,水平段长,
压裂段长,入地液量,脆性矿物,黏土矿物射孔簇数 平均累产气,压裂段数,水平段长,压裂段长,
入地液量,脆性矿物,黏土矿物改造体积 平均累产气,压裂段数,压裂段长,入地液量 水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
脆性矿物,干扰影响比例水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
脆性矿物,干扰影响比例压裂段长 平均累产气,压裂段数,射孔簇数,改造体积,
水平段长,入地液量,总含气量,脆性矿物,
黏土矿物,干扰恢复比例入地液量 平均累产气,压裂段数,射孔簇数,改造体积,
压裂段长,入地砂量,黏土矿物脆性矿物 压裂段数,射孔簇数,水平段长,压裂段长,
黏土矿物黏土矿物 平均累产气,压裂段数,射孔簇数,压裂段长,
入地液量,脆性矿物干扰影响比例 水平段长,干扰恢复比例 干扰恢复比例 压裂段长,干扰影响比例 入地砂量 入地液量 渗透率 孔隙度 孔隙度 渗透率 总含气量 压裂段长 除最小水平主应力外,其余备选因素皆有与其相关的因素,因此选用箱型法筛选最小水平主应力异常值,马氏距离法筛选其余因素异常值,筛选结果见表3。除最小水平主应力存在2个异常值,其余插补后的数据均未见异常值。并且最小水平主应力异常值数量很少,可删除。
表 3 异常值筛选结果
Table 3. Outlier selecting result
因素 自由度 异常值个数 最小水平主应力 2 平均累产气 7 无 压裂段数 8 无 射孔簇数 7 无 改造体积 4 无 水平段长 6 无 压裂段长 10 无 入地液量 7 无 脆性矿物 5 无 黏土矿物 6 无 井间干扰影响比例 2 无 井间干扰恢复比例 2 无 入地砂量 1 无 渗透率 1 无 孔隙度 1 无 总含气量 1 无 -
在聚类分析时若使用全部因素进行分析,那么数据噪声过大,若直接删除与累产量相关性较差的因素,可能损失部分有用信息。针对异常值处理及相关性分析后得到的15个备用因素进行主成分分析,对数据进行降维,以此提取得到由备用因素组合形成的影响因子,最终选定其中5个特征值大于1的变量。计算得到影响因子与备选因素之间的相关性矩阵见表4。
表 4 影响因子与备选因素对应系数矩阵
Table 4. Corresponding coefficient matrix of influential factors and candidate factors
备选因素 Y1 Y2 Y3 Y4 Y5 压裂段长 0.399 0.044 0.112 −0.090 −0.183 压裂段数 0.395 0.135 0.123 −0.083 −0.078 射孔簇数 0.365 0.191 0.199 0.041 0.176 入地液量 0.341 0.265 −0.182 0.253 −0.021 水平段长 0.293 −0.249 −0.021 −0.280 −0.024 黏土矿物 0.266 0.003 −0.132 −0.293 0.373 脆性矿物 0.266 −0.009 0.124 −0.112 0.542 井间干扰恢复比例 0.232 −0.344 −0.195 0.121 −0.288 改造体积 0.230 0.323 −0.230 −0.142 −0.367 井间干扰影响比例 −0.125 0.508 0.257 0.005 0.262 孔隙度 0.101 −0.346 0.324 0.327 0.191 总含气量 0.117 0.002 0.510 −0.183 −0.373 最小水平主应力 −0.110 0.243 0.473 0.116 −0.165 入地砂量 0.156 0.263 −0.263 0.587 0.058 渗透率 0.157 −0.270 0.227 0.458 −0.057 利用k均值聚类法对样本进行分析(表5),优等井、中等井、劣等井分别占比36.4%、37.8%、25.8%,其中优等井、劣等井的聚类中心差值绝对值最大的为Y1影响因子,因此其对A区块页岩气藏产量评价结果影响最大,Y1影响因子的主控因素为压裂因素(压裂段长、压裂段数、射孔簇数、入地液量),在压裂因素中占比最大的为压裂段长。
表 5 聚类分析结果
Table 5. Cluster analysis result
参数 优等井 中等井 劣等井 优劣差绝对值 平均累产气 0.54 0.19 −0.67 1.21 Y1 2.31 −0.1 −2.24 4.55 Y2 0.28 −0.72 0.23 0.05 Y 3 −0.26 0.76 −0.27 0.01 Y 4 0.24 −0.76 0.29 0.05 Y 5 −0.21 0.8 −0.35 0.14 -
基于Python语言,采用随机森林算法对A区块页岩气井进行产量预测。由于不同评价指标往往具有不同量纲,各指标之间可比性较差,因此首先将数据归一化,以进行综合对比评价。归一化使预处理数据被限定在[0,1]之内,让数量级较小的指标也具有“发言权”。随后确定数据标签及特征(标签为平均累产气,特征为其余14个因素),并随机划分训练集和测试集,以避免偶然性。最后将随机森林回归器实例化,通过交叉验证观察模型稳定性:将数据划分为10份,依次使用其中1份作为测试集,其他作为训练集,通过多次计算检验模型精确度及泛化性,交叉验证得到均方误差(MSE)为0.083 5。为进一步检查模型的准确度,随机生成测试集放入模型进行预测,4口井预测结果的均方误差(MSE)为0.014 2,预测准确率为89.32%。
对随机森林模型调参,首先调整最优随机状态值,绘制学习曲线,选出最优随机状态值为30。固定随机状态值,针对树模型数量绘制学习曲线,寻找最优树模型数量。以此类推,遍历各变量寻找最优参数,包括:树模型数量、树最大深度、分枝时考虑最大特征数、叶子节点最少样本数,中间节点分枝所需最小样本数。结果表明在对中间节点分枝所需最小样本数进行调参时,模型准确度不增反降,认为此时模型达到最优,此时调参后模型交叉验证结果MSE为0.055 7,最优参数见表6。
表 6 调参结果
Table 6. Parameter adjustment result
参数 最优值 树模型数量 11 树最大深度 1 分枝时考虑最大特征数 4 叶子节点最少样本数 7 调参后模型相较于未调参模型MSE下降了0.027 8,模型准确率提高了33.29%,可见模型调参效果明显。随机选取的4口井预测结果准确率达98.05%(图3),表明本文建立的基于随机森林的页岩气井产量预测模型具有较高应用价值。
-
(1)提出了一种基于机器学习的页岩气井产量评价与预测方法。运用了较完整的数据处理方法,使用多重插补法对缺失数据进行插补,应用相关性分析得到平均累积产气量以及其他因素之间的相关性,筛选出15个备选因素。
(2)针对异常值处理及相关性分析后得到的15个备选因素进行主成分分析,对数据进行降维,最终采用主成分分析法对特征进行降维,以此在保证数据不失真的前提下获取更高的计算效率。
(3)采用聚类分析方法对A区块页岩气井产量进行了评价,划分出优等井、中等井、劣等井3个等级,并对每口页岩气井进行等级划分。结果表明压裂因素是对A区块页岩气井产量影响最大的因素,其中压裂段长起主要作用,因此为提高产量未来在压裂过程中可着重对压裂段长进行优化设计。
(4)应用随机森林方法对A区块页岩气井进行产量预测,逐步对模型进行调参,得到最优模型,并运用最优模型进行产能预测。结果显示调参后的模型相较于未调参模型均方误差MSE下降了0.027 8,准确率提高33.29%,可见模型调参效果明显,预测准确率达90%以上,证明本文建立的预测模型具有较强实用性。
Shale gas well production evaluation and prediction based on machine learning
-
摘要: 页岩气井产量评价与预测对页岩气高效开发具有重要意义,现有解析模型的假设条件与实际页岩气井差异较大,数值模型计算难度大、效率低、不确定性高,导致页岩气井产量预测难度大。基于机器学习方法综合考虑地质因素与工程因素,整合页岩气开采全周期地质、钻井、压裂、生产等数据,对A页岩气藏气井产量进行了评价与预测。首先,对原始数据体进行处理,包括缺失值插补、相关性分析、异常值处理、主成分分析等,以减小数据的噪声;其次,采用聚类分析方法对页岩气井产量进行评价,研究影响A页岩气藏气井产量的主要因素;最后,应用随机森林方法预测A页岩气藏气井产量。结果表明:A区块页岩气藏中产量优、中、劣等井分别占比36.4%、37.8%、25.8%,其中压裂因素对A页岩气井产量评价结果影响最大。调参后的页岩气井产量预测结果准确度达到90%以上,预测结果较好,表明本文模型能够用于页岩气井产量预测。Abstract: Well production evaluation and prediction are of great significance to the efficient development of shale gas. The assumptions of existing analytical models are more different from actual shale gas wells, and the numerical model has the problems of high calculation difficulty, low efficiency and high uncertainty, which makes the prediction of shale gas well production more difficult. In this paper, the production rates of the gas wells in A shale gas reservoir were evaluated and predicted by integrating the geological, drilling, fracturing and production data in the whole cycle of shale gas production and considering geological factors and engineering factors comprehensively based on machine learning methods. Firstly, the initial data was processed based on themissing value interpolation, correlation analysis, outlier processing and principle component analysis to reduce data noise. Then, the production rates of shale gas wells were evaluated using the cluster analysis method, and the dominated factors influencing the production rates of the gas wells in A shale gas reservoir were analyzed. Finally, the production rates of the gas wells in A shale gas reservoir were predicted by using the random forest method. It is indicated that high, moderate and low production wells in A shale gas reservoir account for 36.4%, 37.8% and 25.8%, respectively, and fracturing factor has the greatest influence on the evaluation results of the production rates of the gas wells in A shale gas reservoir. The prediction accuracy of shale gas well production after parameter adjustment is up to 90%, indicating better prediction accuracy. In conclusion, this proposed model can be used to predict production rates of shale gas wells.
-
Key words:
- shale gas /
- production prediction /
- machine learning /
- cluster analysis /
- random forest /
- smart oil and gas field
-
表 1 A区块页岩气井产量影响因素
Table 1. Factors influencing the production rates of shale gas wells in A Block
参数 数值 参数 数值 渗透率/
10−6 μm264.10~480.92 水平段长/m 1 500~2 200 孔隙度/% 5.30~6.43 压裂段数 12~33 总有机碳
含量/%3.1~5.5 射孔簇数 38~125 游离气/
(m3 · t−1)1.05~4.60 改造体积/
104 m32 405.00~
8 188.04吸附气/
(m3 · t−1)0.98-3.03 压裂段长/m 747~2 154 总含气量/
(m3 · t−1)3.88~5.75 加砂强度/
(t · m−3)0.32~2.14 泊松比 0.20~0.25 入地液量/m3 9 760~65 063 最小水平
主应力/MPa63.22~79.90 入地砂量/t 640.60~
3 674.25破裂压力/
MPa65.17~99.10 砂液比/
(t · m−3)0.04~0.07 碳酸盐岩
矿物/%8.50~18.45 井间干扰
影响比例/%47~100 脆性矿物/% 55.42~76.77 井间干扰
恢复比例/%0~93 黏土矿物/% 10.47~26.50 干扰距离/m 100~1 200 石英/% 40.90~49.15 长石/% 5.51~8.91 脆性指数 59.95~72.34 表 2 各备选因素对应的相关因素
Table 2. Correlation factors corresponding to different candidate factors
备选因素 相关因素 平均累产气 压裂段数,射孔簇数,改造体积,水平段长,
压裂段长,入地液量,黏土矿物压裂段数 平均累产气,射孔簇数,改造体积,水平段长,
压裂段长,入地液量,脆性矿物,黏土矿物射孔簇数 平均累产气,压裂段数,水平段长,压裂段长,
入地液量,脆性矿物,黏土矿物改造体积 平均累产气,压裂段数,压裂段长,入地液量 水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
脆性矿物,干扰影响比例水平段长 平均累产气,压裂段数,射孔簇数,压裂段长,
脆性矿物,干扰影响比例压裂段长 平均累产气,压裂段数,射孔簇数,改造体积,
水平段长,入地液量,总含气量,脆性矿物,
黏土矿物,干扰恢复比例入地液量 平均累产气,压裂段数,射孔簇数,改造体积,
压裂段长,入地砂量,黏土矿物脆性矿物 压裂段数,射孔簇数,水平段长,压裂段长,
黏土矿物黏土矿物 平均累产气,压裂段数,射孔簇数,压裂段长,
入地液量,脆性矿物干扰影响比例 水平段长,干扰恢复比例 干扰恢复比例 压裂段长,干扰影响比例 入地砂量 入地液量 渗透率 孔隙度 孔隙度 渗透率 总含气量 压裂段长 表 3 异常值筛选结果
Table 3. Outlier selecting result
因素 自由度 异常值个数 最小水平主应力 2 平均累产气 7 无 压裂段数 8 无 射孔簇数 7 无 改造体积 4 无 水平段长 6 无 压裂段长 10 无 入地液量 7 无 脆性矿物 5 无 黏土矿物 6 无 井间干扰影响比例 2 无 井间干扰恢复比例 2 无 入地砂量 1 无 渗透率 1 无 孔隙度 1 无 总含气量 1 无 表 4 影响因子与备选因素对应系数矩阵
Table 4. Corresponding coefficient matrix of influential factors and candidate factors
备选因素 Y1 Y2 Y3 Y4 Y5 压裂段长 0.399 0.044 0.112 −0.090 −0.183 压裂段数 0.395 0.135 0.123 −0.083 −0.078 射孔簇数 0.365 0.191 0.199 0.041 0.176 入地液量 0.341 0.265 −0.182 0.253 −0.021 水平段长 0.293 −0.249 −0.021 −0.280 −0.024 黏土矿物 0.266 0.003 −0.132 −0.293 0.373 脆性矿物 0.266 −0.009 0.124 −0.112 0.542 井间干扰恢复比例 0.232 −0.344 −0.195 0.121 −0.288 改造体积 0.230 0.323 −0.230 −0.142 −0.367 井间干扰影响比例 −0.125 0.508 0.257 0.005 0.262 孔隙度 0.101 −0.346 0.324 0.327 0.191 总含气量 0.117 0.002 0.510 −0.183 −0.373 最小水平主应力 −0.110 0.243 0.473 0.116 −0.165 入地砂量 0.156 0.263 −0.263 0.587 0.058 渗透率 0.157 −0.270 0.227 0.458 −0.057 表 5 聚类分析结果
Table 5. Cluster analysis result
参数 优等井 中等井 劣等井 优劣差绝对值 平均累产气 0.54 0.19 −0.67 1.21 Y1 2.31 −0.1 −2.24 4.55 Y2 0.28 −0.72 0.23 0.05 Y 3 −0.26 0.76 −0.27 0.01 Y 4 0.24 −0.76 0.29 0.05 Y 5 −0.21 0.8 −0.35 0.14 表 6 调参结果
Table 6. Parameter adjustment result
参数 最优值 树模型数量 11 树最大深度 1 分枝时考虑最大特征数 4 叶子节点最少样本数 7 -
[1] 马新华, 谢军, 雍锐, 等. 四川盆地南部龙马溪组页岩气储集层地质特征及高产控制因素[J]. 石油勘探与开发, 2020, 47(5):841-855. doi: 10.11698/PED.2020.05.01 MA Xinhua, XIE Jun, YONG Rui, et al. Geological characteristics and high production control factors of shale gas reservoirs in Silurian Longmaxi Formation, southern Sichuan Basin, SW China[J]. Petroleum Exploration and Development, 2020, 47(5): 841-855. doi: 10.11698/PED.2020.05.01 [2] MCCLURE M W, BABAZADEH M, SHIOZAWA S, et al. Fully coupled hydromechanical simulation of hydraulic fracturing in 3D discrete-fracture networks[J]. SPE Journal, 2016, 21(4): 1302-1320. doi: 10.2118/173354-PA [3] ZOBACK M D, KOHLI A H. Stimulating production from unconventional reservoirs[M]// ZOBACK M D, KOHLI A H. Unconventional reservoir geomechanics-shale gas, tight oil, and induced seismicity. Cambridge: Cambridge University Press, 2019: 231-374. [4] 时贤, 程远方, 常鑫, 等. 页岩气水平井段内多簇裂缝同步扩展模型建立与应用[J]. 石油钻采工艺, 2018, 40(2):247-252. doi: 10.13639/j.odpt.2018.02.018 SHI Xian, CHENG Yuanfang, CHANG Xin, et al. Establishment and application of the model for the synchronous propagation of multi-cluster fractures in the horizontal section of shale-gas horizontal well[J]. Oil Drilling & Production Technology, 2018, 40(2): 247-252. doi: 10.13639/j.odpt.2018.02.018 [5] WANG K, JIANG BB, LI H T, et al. Rapid and accurate evaluation of reserves in different types of shale-gas wells: production-decline analysis[J]. International Journal of Coal Geology, 2020, 218: 103359. doi: 10.1016/j.coal.2019.103359 [6] LIANG H B, ZHANG L H, ZHAO Y L, et al. Empirical methods of decline-curve analysis for shale gas reservoirs: review, evaluation, and application[J]. Journal of Natural Gas Science and Engineering, 2020, 83: 103531. doi: 10.1016/j.jngse.2020.103531 [7] GUINDON L. Determining interwell connectivity and reservoir complexity through fracturing pressure hits and production-interference analysis[J]. Journal of Canadian Petroleum Technology, 2015, 54(2): 88-91. doi: 10.2118/0315-088-JCPT [8] JACOBS T. Oil and gas producers find frac hits in shale wells a major challenge[J]. Journal of Petroleum Tech- nology, 2017, 69(4): 29-34. doi: 10.2118/0417-0029-JPT [9] ZHANG R H, ZHANG L H, TANG H Y, et al. A simulator for production prediction of multistage fractured horizontal well in shale gas reservoir considering complex fracture geometry[J]. Journal of Natural Gas Science and Engineering, 2019, 67: 14-29. doi: 10.1016/j.jngse.2019.04.011 [10] 段永刚, 张泰来, 魏明强, 等. 页岩气藏“井工厂”模式下水平井裂缝分布优化[J]. 油气藏评价与开发, 2019, 9(6):78-84. doi: 10.13809/j.cnki.cn32-1825/te.2019.06.014 DUAN Yonggang, ZHANG Tailai, WEI Mingqiang, et al. Optimization of fracture layout of fractured horizontal well in multi-well pad mode of shale gas reservoirs[J]. Reservoir Evaluation and Development, 2019, 9(6): 78-84. doi: 10.13809/j.cnki.cn32-1825/te.2019.06.014 [11] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016: 12-13. ZHOU Zhihua. Machine learning[M]. Beijing: Tsinghua University Press, 2016: 12-13. [12] 李帅, 陈军斌, 曹毅, 等. 基于灰色关联分析法的页岩储层脆性影响因素研究[J]. 中国矿业, 2019, 28(2):169-174,180. LI Shuai, CHEN Junbin, CAO Yi, et al. Study on the influence factors of shale reservoir brittleness based on grey correlation analysis[J]. China Mining Magazine, 2019, 28(2): 169-174,180. [13] 檀朝东, 贺甲元, 周彤, 等. 基于PCA-BNN的页岩气压裂施工参数优化[J]. 西南石油大学学报(自然科学版), 2020, 42(6):56-62. doi: 10.11885/j.issn.1674-5086.2020.05.12.05 TAN Chaodong, HE Jiayuan, ZHOU Tong, et al. A study on the optimization of fracturing operation parameters based on PCA-BNN[J]. Journal of Southwest Petroleum University(Science & Technology Edition), 2020, 42(6): 56-62. doi: 10.11885/j.issn.1674-5086.2020.05.12.05 [14] 孙艺涵. 基于机器学习的页岩有机质含量预测方法研究[D]. 北京: 中国石油大学(北京), 2019. SUN Yihan. Research on prediction method of total organic carbon in shale based on machine learning[D]. Beijing: China University of Petroleum(Beijing), 2019. [15] 杜娟, 刘志刚, 宋考平, 等. 基于卷积神经网络的抽油机故障诊断[J]. 电子科技大学学报, 2020, 49(5):751-757. doi: 10.12178/1001-0548.2019205 DU Juan, LIU Zhigang, SONG Kaoping, et al. Fault diagnosis of pumping unit based on convolutional neural network[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(5): 751-757. doi: 10.12178/1001-0548.2019205 [16] 纪磊, 李菊花, 肖佳林. 随机森林算法在页岩气田多段压裂改造中的应用[J]. 大庆石油地质与开发, 2020, 39(6):168-174. doi: 10.19597/J.ISSN.1000-3754.201908015 JI Lei, LI Juhua, XIAO Jialin. Application of random forest algorithm in the multistage fracturing stimulation of shale gas field[J]. Petroleum Geology & Oilfield Development in Daqing, 2020, 39(6): 168-174. doi: 10.19597/J.ISSN.1000-3754.201908015 [17] 祝元宠, 咸玉席, 李清宇, 等. 基于大数据的页岩气产能预测[J]. 油气井测试, 2019, 28(1):1-6. doi: 10.19680/j.cnki.1004-4388.2019.01.001 ZHU Yuanchong, XIAN Yuxi, LI Qingyu, et al. Shale gas productivity forecast based on big data[J]. Well Testing, 2019, 28(1): 1-6. doi: 10.19680/j.cnki.1004-4388.2019.01.001 [18] 刘巍, 刘威, 谷建伟. 基于机器学习方法的油井日产油量预测[J]. 石油钻采工艺, 2020, 42(1):70-75. doi: 10.13639/j.odpt.2020.01.012 LIU Wei, LIU Wei, GU Jianwei. Oil production prediction based on a machine learning method[J]. Oil Drilling & Production Technology, 2020, 42(1): 70-75. doi: 10.13639/j.odpt.2020.01.012 [19] 辛欣, 王海彬, 罗建男, 等. 基于机器学习方法的海洋天然气水合物水平井降压开采模拟—优化耦合模型[J]. 天然气工业, 2020, 40(8):149-158. doi: 10.3787/j.issn.1000-0976.2020.08.012 XIN Xin, WANG Haibin, LUO Jiannan, et al. Simulation-optimization coupling model for the depressurization production of marine natural gas hydrate in horizontal wells based on machine learning method[J]. Natural Gas Industry, 2020, 40(8): 149-158. doi: 10.3787/j.issn.1000-0976.2020.08.012 [20] 朱庆忠, 胡秋嘉, 杜海为, 等. 基于随机森林算法的煤层气直井产气量模型[J]. 煤炭学报, 2020, 45(8):2846-2855. doi: 10.13225/j.cnki.jccs.2020.0205 ZHU Qingzhong, HU Qiujia, DU Haiwei, et al. A gas production model of vertical coalbed methane well based on random forest algorithm[J]. Journal of China Coal Society, 2020, 45(8): 2846-2855. doi: 10.13225/j.cnki.jccs.2020.0205 [21] GONG X L, GONZALEZ R, MCVAY D A, et al. Bayesian probabilistic decline-curve analysis reliably quantifies uncertainty in shale-well-production forecasts[J]. SPE Journal, 2014, 19(6): 1047-1057. doi: 10.2118/147588-PA [22] YU W, TAN X S, ZUO L H, et al. A new probabilistic approach for uncertainty quantification in well performance of shale gas reservoirs[J]. SPE Journal, 2016, 21(6): 2038-2048. doi: 10.2118/183651-PA [23] 马文礼, 李治平, 孙玉平, 等. 基于机器学习的页岩气产能非确定性预测方法研究[J]. 特种油气藏, 2019, 26(2):101-105. doi: 10.3969/j.issn.1006-6535.2019.02.018 MA Wenli, LI Zhiping, SUN Yuping, et al. Non-deterministic shale gas productivity forecast based on machine learning[J]. Special Oil & Gas Reservoirs, 2019, 26(2): 101-105. doi: 10.3969/j.issn.1006-6535.2019.02.018 [24] 李菊花, 陈晨, 肖佳林. 基于随机森林算法的页岩气多段压裂井产量预测[J]. 长江大学学报(自然科学版), 2020, 17(4):34-38,7. doi: 10.16772/j.cnki.1673-1409.2020.04.006 LI Juhua, CHEN Chen, XIAO Jialin. Yield prediction of shale gas multi-stage fracturing wells based on random forest algorithm[J]. Journal of Yangtze University (Natural Science Edition), 2020, 17(4): 34-38,7. doi: 10.16772/j.cnki.1673-1409.2020.04.006 [25] 严子铭, 王涛, 柳占立, 等. 基于机器学习的页岩气采收率预测方法[J]. 固体力学学报, 2021, 42(3):221-232. doi: 10.19636/j.cnki.cjsm42-1250/o3.2021.027 YAN Ziming, WANG Tao, LIU Zhanli, et al. Machine-learning-based prediction methods on shale gas recovery[J]. Chinese Journal of Solid Mechanics, 2021, 42(3): 221-232. doi: 10.19636/j.cnki.cjsm42-1250/o3.2021.027 [26] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324 [27] 秦璇. 随机森林算法的改进及应用[D]. 兰州: 兰州交通大学, 2020. QIN Xuan. Improvement and application of randome forest algorithm[D]. Lanzhou: Lanzhou Jiaotong University, 2020. [28] SARDINHA C, PETR C, LehmannJ, et al. Determining interwell connectivity and reservoir complexity through frac pressure hits and production interference analysis[C]//SPE/CSUR Unconventional Resources Conference-Canada, Calgary, Alberta, Canada, 2014: SPE-171628-MS. DOI: 10.2118/171628-MS. -