基于稀疏滤波的潜油电泵故障诊断方法

韦龙贵 付军 黄新春 张光一 高小永 张誉 丁昆鹏 李启帆 陈硕

韦龙贵,付军,黄新春,张光一,高小永,张誉,丁昆鹏,李启帆,陈硕. 基于稀疏滤波的潜油电泵故障诊断方法[J]. 石油钻采工艺,2023,45(1):116-124 doi:  10.13639/j.odpt.2023.01.015
引用本文: 韦龙贵,付军,黄新春,张光一,高小永,张誉,丁昆鹏,李启帆,陈硕. 基于稀疏滤波的潜油电泵故障诊断方法[J]. 石油钻采工艺,2023,45(1):116-124 doi:  10.13639/j.odpt.2023.01.015
WEI Longgui, FU Jun, HUANG Xinchun, ZHANG Guangyi, GAO Xiaoyong, ZHANG Yu, DING Kunpeng, LI Qifan, CHEN Shuo. ESP fault diagnosis method based on sparse filtering[J]. Oil Drilling & Production Technology, 2023, 45(1): 116-124 doi:  10.13639/j.odpt.2023.01.015
Citation: WEI Longgui, FU Jun, HUANG Xinchun, ZHANG Guangyi, GAO Xiaoyong, ZHANG Yu, DING Kunpeng, LI Qifan, CHEN Shuo. ESP fault diagnosis method based on sparse filtering[J]. Oil Drilling & Production Technology, 2023, 45(1): 116-124 doi:  10.13639/j.odpt.2023.01.015

基于稀疏滤波的潜油电泵故障诊断方法

doi: 10.13639/j.odpt.2023.01.015
基金项目: 国家重点研发计划“水下生产系统故障诊断及智能预警技术研究”(编号:2016YFC0303703); 中国石油大学(北京)科研基金“一类复杂大规模MINLP问题的分片线性规划方法研究”(编号:2462017YJRC028)
详细信息
    作者简介:

    韦龙贵(1978-),2000年毕业于西安石油大学石油工程专业,现为中国石油大学(北京)在读博士研究生,主要研究方向为海上油气钻采工程,高级工程师。通迅地址:(300452)天津市滨海新区新港街道渤海石油路688号。电话:022-25800088。E-mail: weilg2@cnooc.com.cn

    通讯作者:

    付军(1984-),2007年毕业于清华大学项目管理工程专业, 现从事智能油田工作,高级工程师。通讯地址:(300452)天津市滨海新区新港街道渤海石油路688号。E-mail: fujun8@cnooc.com.cn

  • 中图分类号: TE933+.3;TP183

ESP fault diagnosis method based on sparse filtering

  • 摘要: 潜油电泵作为一种常见的人工举升装置,由于其强提液能力而广泛应用在海上油田,但海洋环境复杂且潜油电泵故障类型繁多与故障数据匮乏等原因使其在海上油田应用存在着一定的局限性。针对难以有效地在线诊断与定量分析潜油电泵电流信号等问题,提出了一种需要极少超参数调节的稀疏滤波特征提取方法,该方法对多种工况电流信号进行了有效的特征提取与模式识别,得到了一个准确、高效的实时诊断模型,通过对现场数据进行分析,验证了该方法的有效性。实验结果表明,该方法可有效地提取特征并实现海上油田潜油电泵10种故障状态的故障诊断,诊断准确率高达99.1%。随着数据的不断丰富和故障种类的不断完善,可实现更高效、准确的故障诊断。
  • 图  1  稀疏滤波网络结构

    Figure  1.  Sparse filtering network structure

    图  2  稀疏滤波故障诊断流程

    Figure  2.  Sparse filtering based fault diagnosis process

    图  3  稀疏滤波特征均化前后对比

    Figure  3.  Characteristics comparison of sparse filtering before and after homogenization

    图  4  t-SNE算法对稀疏滤波分类结果的可视化效果图

    Figure  4.  Visual chart of sparse filtering classification result based on t-SNE algorithm

    图  5  不同输出维度下的稀疏滤波效果图

    Figure  5.  Sparse filtering rendering at different output dimensions

    图  6  不同输出维度下稀疏滤波算法准确率和计算时间

    Figure  6.  Diagnosis accuracy and calculation time of sparse filtering algorithmat at different output dimensions

    图  7  不同均化过程下稀疏滤波算法准确率和计算时间

    Figure  7.  Accuracy and calculation time of sparse filtering algorithm in different homogenization processes

    图  8  不同输入维度下稀疏滤波算法准确率和计算时间

    Figure  8.  Accuracy and calculation time of sparse filtering algorithm at different input dimensions

    图  9  不同训练数据占比下稀疏滤波算法准确率和计算时间

    Figure  9.  Accuracy and calculation time of sparse filtering algorithm at different training data ratios

    图  10  稀疏滤波算法中的激活函数

    Figure  10.  Activation function of sparse filtering algorithm

    图  11  不同激活函数诊断结果

    Figure  11.  Diagnosis results of different activation functions

    表  1  渤海油田潜油电泵的故障模式与编号

    Table  1.   ESP fault mode in Bohai Oilfield

    潜油电泵编号故障类型故障发生时间
    XXX9-3-BXX 产液异常降低 2019−06
    XXX9-9-JXX 稠油 2018−08
    XXX9-3-A22SXX 电机故障 2020−03
    XXX9-3-A09SXX 电缆击穿 2019−01
    XXX9-3-E02SXX 流道堵塞 2019−01
    XXX9-3-E09SXX 电气性能故障 2017−03
    XXX9-3-EXX 管柱漏失 2020−11
    XXX9-3-CXX 砂卡 2016−05
    XXX5-6-FXX 乳化 2019−08
    XXX9-3-E20SXX 正常(未发生故障) 2019−09(数据采样时间)
    下载: 导出CSV

    表  2  不同工况下的故障诊断准确率结果

    Table  2.   Fault diagnosis accuracy under different working conditions

    实际
    标签
    不同工况故障诊断准确率/%
    0123456789
    095.35502.1862.459000000
    1010000000000
    22.535092.3943.09901.9720000
    3000100000000
    4000095.94204.058000
    50000099.1550.845000
    600000.831099.169000
    7000000010000
    80002.21601.1081.662095.0140
    9000000000100
    下载: 导出CSV

    表  3  不同诊断方法对比

    Table  3.   Comparison between different diagnosis methods

    方法诊断准确率/%是否在线诊断诊断工况数
    电流卡片阈值法87.510
    BP神经网络926
    极限学习机95.75
    KNN、RF、SVM975
    多分类器91.835
    多算法融合94.915
    稀疏滤波99.110
    下载: 导出CSV
  • [1] 梅思杰, 邵永实, 刘军, 等. 潜油电泵技术[M]. 北京: 石油工业出版社, 2004.

    MEI Sijie, SHAO Yongshi, LIU Jun, et al. Electric submersible pump technology[M]. Beijing: Petroleum Industry Press, 2004.
    [2] 冉从俊. 电潜泵采油及其发展趋势研究[J]. 中国石油和化工标准与质量, 2020, 40(4):108-109. doi:  10.3969/j.issn.1673-4076.2020.04.054

    RAN Congjun. Research on electric submersible pump production and its development trend[J]. China Petroleum and Chemical Standard and Quality, 2020, 40(4): 108-109. doi:  10.3969/j.issn.1673-4076.2020.04.054
    [3] 姜帅. 基于井下信息监测的海上电泵井工况诊断技术研究[D]. 北京: 中国石油大学(北京), 2019.

    JIANG Shuai. Study on diagnosis technology of marine ESP well operating conditions based on underground information monitoring[D]. Beijing: China University of Petroleum, 2019.
    [4] 刘西广. 电潜泵故障模式识别模型研究[D]. 合肥: 合肥工业大学, 2003.

    LIU Xiguang. A study on the fault model of electrical submersible pump[D]. Hefei: Hefei University of Technology, 2003.
    [5] 陈治国, 冯定, 朱木秀, 等. 基于模式识别的电流卡片特征提取方法研究[J]. 石油机械, 2004, 32(2):38-41. doi:  10.3969/j.issn.1001-4578.2004.02.013

    CHEN Zhiguo, FENG Ding, ZHU Muxiu, et al. A character pick-up method of current cards based on pattern recognition[J]. China Petroleum Machinery, 2004, 32(2): 38-41. doi:  10.3969/j.issn.1001-4578.2004.02.013
    [6] 彭科翔. 基于BP神经网络的潜油电泵故障诊断[J]. 石油化工高等学校学报, 2016, 29(1):76-79. doi:  10.3969/j.issn.1006-396X.2016.01.015

    PENG Kexiang. Fault diagnosis of electric submersible pump based on BP neural network[J]. Journal of Petrochemical Universities, 2016, 29(1): 76-79. doi:  10.3969/j.issn.1006-396X.2016.01.015
    [7] 乔雨. 潜油电泵井上数字式电流卡片的运用[J]. 化学工程与装备, 2017(1):114-115. doi:  10.19566/j.cnki.cn35-1285/tq.2017.01.041

    QIAO Yu. Application of digital current card on submersible electric pump wells[J]. Fujian Chemical Industry, 2017(1): 114-115. doi:  10.19566/j.cnki.cn35-1285/tq.2017.01.041
    [8] ZHANG Panlong, CHEN Tingkai, WANG Guochao, et al. Ocean economy and fault diagnosis of electric submersible pump applied in floating platform[J]. International Journal of e-Navigation and Maritime Economy, 2017, 6: 37-43. doi:  10.1016/j.enavi.2017.05.005
    [9] 张瑞超, 尹玉琼, 徐林颖, 等. 基于特征识别的电潜泵井工况智能诊断新方法[J]. 中国石油大学胜利学院学报, 2018, 32(4):41-45. doi:  10.3969/j.issn.1673-5935.2018.04.010

    ZHANG Ruichao, YIN Yuqiong, XU Linying, et al. New method for intelligent diagnosis of working conditions in electrical submersible pump well based on feature recognition[J]. Journal of Shengli College China University of Petroleum, 2018, 32(4): 41-45. doi:  10.3969/j.issn.1673-5935.2018.04.010
    [10] 杜林辉, 丁磊, 田景, 等. 电潜泵井憋压法计算动液面技术及其应用[J]. 石油钻采工艺, 2011, 33(3):116-118. doi:  10.3969/j.issn.1000-7393.2011.03.031

    DU Linhui, DING Lei, TIAN Jing, et al. Pressure-out method to calculate dynamic liquid level in electric submersible pump well and its application[J]. Oil Drilling & Production Technology, 2011, 33(3): 116-118. doi:  10.3969/j.issn.1000-7393.2011.03.031
    [11] 吴绍伟, 于志刚, 廖云虎, 等. 基于系统分析的电潜泵井动态分析与故障诊断综合技术研究[J]. 中国石油和化工标准与质量, 2014, 34(4):67-68. doi:  10.3969/j.issn.1673-4076.2014.04.069

    WU Shaowei, YU Zhigang, LIAO Yunhu, et al. Research on comprehensive techniques for dynamic analysis and fault diagnosis of electric submersible pump wells based on system analysis[J]. China Petroleum and Chemical Standard and Quality, 2014, 34(4): 67-68. doi:  10.3969/j.issn.1673-4076.2014.04.069
    [12] 赵方剑. 电潜泵生产系统工况诊断理论与技术研究[D]. 青岛: 中国石油大学(华东), 2010.

    ZHAO Fangjian. Research on state monitoring and fault diagnosis technology of electrical submersible pump well[D]. Qingdao: China University of Petroleum (East China), 2010.
    [13] 杜伟山. 基于振动信号分析的电潜柱塞泵故障诊断方法研究[J]. 石油矿场机械, 2018, 47(4):8-13. doi:  10.3969/j.issn.1001-3482.2018.04.002

    DU Weishan. Research of fault diagnosis method based on vibration signal analysis for electric submersible plunger pump[J]. Oil Field Equipment, 2018, 47(4): 8-13. doi:  10.3969/j.issn.1001-3482.2018.04.002
    [14] ALGULIYEV R, IMAMVERDIYEV Y, SUKHOSTAT L. Intelligent diagnosis of petroleum equipment faults using a deep hybrid model[J]. SN Applied Sciences, 2020, 2(5): 924. doi:  10.1007/s42452-020-2741-0
    [15] DE ASSIS BOLDT F, RAUBER T W, VAREJÃO F M, et al. Performance analysis of extreme learning machine for automatic diagnosis of electrical submersible pump conditions[C]//2014 12th IEEE International Conference on Industrial Informatics (INDIN). Porto Alegre, Brazil: IEEE, 2014: 67-72.
    [16] OLIVEIRA-SANTOS T, RAUBER T W, VAREJÃO F M, et al. Submersible motor pump fault diagnosis system: a comparative study of classification methods[C]//2016 IEEE 28th International Conference on Tools with Artificial Intelligence (ICTAI). San Jose, CA, USA: IEEE, 2016: 415-422.
    [17] DE ASSIS BOLDT F, RAUBER T W, OLIVEIRA-SANTOS T, et al. Binary feature selection classifier ensemble for fault diagnosis of submersible motor pump[C]//2017 IEEE 26th International Symposium on Industrial Electronics (ISIE). Edinburgh, UK: IEEE, 2017: 1807-1812.
    [18] OLIVEIRA-SANTOS T, RODRIGUES A, ROCHA V F, et al. Combining classifiers with decision templates for automatic fault diagnosis of electrical submersible pumps[J]. Integrated Computer-Aided Engineering, 2018, 25(4): 381-396. doi:  10.3233/ICA-180574
    [19] 檀朝东,黄新春,王松,等. 机理仿真与数据驱动融合的电泵举升故障诊断预警理论研究进展[J]. 石油钻采工艺, 2021, 43(4):483-488. doi:  10.13639/j.odpt.2021.04.011

    TAN Chaodong, HUANG Xinchun, WANG Song, et al. Research progress on fault diagnosis and early warning theory of electric submersible pump lifting based on mechanism simulation and data driven fusion[J]. Oil Drilling & Production Technology, 2021, 43(4): 483-488. doi:  10.13639/j.odpt.2021.04.011
    [20] 王彪,韩国庆,路鑫,等. 基于机器学习的电潜泵工况诊断[J]. 石油钻采工艺, 2022, 44(2):261-268. doi:  10.13639/j.odpt.2022.02.019

    WANG Biao, HAN Guoqing, LU Xin, et al. Working condition diagnosis of electric submersible pump based on machine learning[J]. Oil Drilling & Production Technology, 2022, 44(2): 261-268. doi:  10.13639/j.odpt.2022.02.019
  • [1] 王彪, 韩国庆, 路鑫, 谭帅, 朱志勇, 梁星原.  基于机器学习的电潜泵工况诊断 . 石油钻采工艺, 2022, 44(2): 261-268. doi: 10.13639/j.odpt.2022.02.019
    [2] 檀朝东, 黄新春, 王松, 张光一, 付军, 杜广浩.  机理仿真与数据驱动融合的电泵举升故障诊断预警理论研究进展 . 石油钻采工艺, 2021, 43(4): 483-488. doi: 10.13639/j.odpt.2021.04.011
    [3] 刘芑辰, 冯子明, 蒋国斌, 孙桐建, 李琦.  基于卷积神经网络模型的抽油机系统故障诊断 . 石油钻采工艺, 2021, 43(6): 777-781. doi: 10.13639/j.odpt.2021.06.014
    [4] 古小红, 韩国庆, 竺彪.  基于井口憋压分析的电泵井工况诊断 . 石油钻采工艺, 2016, 38(4): 514-518. doi: 10.13639/j.odpt.2016.04.021
    [5] 黄新春, 郑春峰, 李昂, 苏作飞.  QHD32-6油田电泵机组故障预测方法及其现场应用 . 石油钻采工艺, 2014, 36(1): 116-119.
    [6] 刘玉国.  稠油潜油电泵工作寿命影响因素分析及治理 . 石油钻采工艺, 2014, 36(4): 75-78. doi: 10.13639/j.odpt.2014.04.019
    [7] 杜林辉, 刘玉国, 刘瑞, 睢芬, 涂东.  超稠油潜油电泵尾管装置的研制与应用   . 石油钻采工艺, 2013, 35(4): 103-105.
    [8] 欧阳铁兵, 吴绍伟, 于志刚, 曾玉斌, 穆永威, 张崇.  电潜泵工况仪参数应用实践 . 石油钻采工艺, 2012, 34(6): 119-121.
    [9] 甘露, 王仪, 王波.  BP神经网络在电潜泵井故障诊断中的应用 . 石油钻采工艺, 2011, 33(2): 124-127.
    [10] 吕彦平, 吴晓东, 李朝霞, 师俊峰, 刘伟.  层次分析法在螺杆泵井故障诊断中的应用 . 石油钻采工艺, 2008, 30(6): 80-82.
    [11] 段礼祥.  螺杆泵驱动装置故障智能诊断方法 . 石油钻采工艺, 2007, 29(1): 37-39. doi: 10.3969/j.issn.1000-7393.2007.01.012
    [12] 张峙, 左锋.  倒置式潜油电泵井下增压注水技术研究与应用 . 石油钻采工艺, 2007, 29(6): 35-37. doi: 10.3969/j.issn.1000-7393.2007.06.012
    [13] 刘长松, 曹言光, 张文昌, 方前程, 张庆生.  107系列耐高温小直径潜油电机 . 石油钻采工艺, 2003, 25(1): 71-73. doi: 10.3969/j.issn.1000-7393.2003.01.023
    [14] 吴晓东, 王世展, 王智深.  地面驱动螺杆泵采油系统故障诊断方法 . 石油钻采工艺, 2003, 25(5): 82-84. doi: 10.3969/j.issn.1000-7393.2003.05.022
    [15] 赵明, 郑俊德, 孙智.  聚驱螺杆泵采油系统优化设计与故障诊断分析系统 . 石油钻采工艺, 2002, 24(3): 44-47. doi: 10.3969/j.issn.1000-7393.2002.03.015
    [16] 张积明, 马春成.  胜利油田有杆泵抽油系统常见故障原因调查及改进措施 . 石油钻采工艺, 2000, 22(1): 73-76. doi: 10.3969/j.issn.1000-7393.2000.01.021
    [17] 李安, 张嗣伟.  有杆泵抽油井故障诊断专家系统 . 石油钻采工艺, 1995, 17(6): 89-92. doi: 10.3969/j.issn.1000-7393.1995.06.020
    [18] 程时清.  段塞流压力诊断曲线特征点分析新方法 . 石油钻采工艺, 1994, 16(5): 50-52,59. doi: 10.3969/j.issn.1000-7393.1994.05.013
    [19] 王玉成, 查建中, 赵振英, 郭军.  智能工程在抽油机井故障诊断中的应用 . 石油钻采工艺, 1993, 15(3): 60-68. doi: 10.3969/j.issn.1000-7393.1993.03.012
    [20] 刘振臣.  DG-1型潜油电泵动力电缆故障测试仪简介 . 石油钻采工艺, 1993, 15(1): 87-93. doi: 10.3969/j.issn.1000-7393.1993.01.021
  • 加载中
图(11) / 表 (3)
计量
  • 文章访问数:  0
  • HTML全文浏览量:  42
  • PDF下载量:  13
  • 被引次数: 0
出版历程
  • 修回日期:  2023-01-05
  • 网络出版日期:  2023-06-15
  • 刊出日期:  2023-01-20

基于稀疏滤波的潜油电泵故障诊断方法

doi: 10.13639/j.odpt.2023.01.015
    基金项目:  国家重点研发计划“水下生产系统故障诊断及智能预警技术研究”(编号:2016YFC0303703); 中国石油大学(北京)科研基金“一类复杂大规模MINLP问题的分片线性规划方法研究”(编号:2462017YJRC028)
    作者简介:

    韦龙贵(1978-),2000年毕业于西安石油大学石油工程专业,现为中国石油大学(北京)在读博士研究生,主要研究方向为海上油气钻采工程,高级工程师。通迅地址:(300452)天津市滨海新区新港街道渤海石油路688号。电话:022-25800088。E-mail: weilg2@cnooc.com.cn

    通讯作者: 付军(1984-),2007年毕业于清华大学项目管理工程专业, 现从事智能油田工作,高级工程师。通讯地址:(300452)天津市滨海新区新港街道渤海石油路688号。E-mail: fujun8@cnooc.com.cn
  • 中图分类号: TE933+.3;TP183

摘要: 潜油电泵作为一种常见的人工举升装置,由于其强提液能力而广泛应用在海上油田,但海洋环境复杂且潜油电泵故障类型繁多与故障数据匮乏等原因使其在海上油田应用存在着一定的局限性。针对难以有效地在线诊断与定量分析潜油电泵电流信号等问题,提出了一种需要极少超参数调节的稀疏滤波特征提取方法,该方法对多种工况电流信号进行了有效的特征提取与模式识别,得到了一个准确、高效的实时诊断模型,通过对现场数据进行分析,验证了该方法的有效性。实验结果表明,该方法可有效地提取特征并实现海上油田潜油电泵10种故障状态的故障诊断,诊断准确率高达99.1%。随着数据的不断丰富和故障种类的不断完善,可实现更高效、准确的故障诊断。

English Abstract

韦龙贵,付军,黄新春,张光一,高小永,张誉,丁昆鹏,李启帆,陈硕. 基于稀疏滤波的潜油电泵故障诊断方法[J]. 石油钻采工艺,2023,45(1):116-124 doi:  10.13639/j.odpt.2023.01.015
引用本文: 韦龙贵,付军,黄新春,张光一,高小永,张誉,丁昆鹏,李启帆,陈硕. 基于稀疏滤波的潜油电泵故障诊断方法[J]. 石油钻采工艺,2023,45(1):116-124 doi:  10.13639/j.odpt.2023.01.015
WEI Longgui, FU Jun, HUANG Xinchun, ZHANG Guangyi, GAO Xiaoyong, ZHANG Yu, DING Kunpeng, LI Qifan, CHEN Shuo. ESP fault diagnosis method based on sparse filtering[J]. Oil Drilling & Production Technology, 2023, 45(1): 116-124 doi:  10.13639/j.odpt.2023.01.015
Citation: WEI Longgui, FU Jun, HUANG Xinchun, ZHANG Guangyi, GAO Xiaoyong, ZHANG Yu, DING Kunpeng, LI Qifan, CHEN Shuo. ESP fault diagnosis method based on sparse filtering[J]. Oil Drilling & Production Technology, 2023, 45(1): 116-124 doi:  10.13639/j.odpt.2023.01.015
    • 潜油电泵由多个部件构成,结构较为复杂,并且关联性较强[1]。随着传统潜油电泵故障诊断方法越来越无法满足油田开采要求,现代潜油电泵故障诊断方法也就由此出现。现代潜油电泵故障诊断方法主要有3种:(1)故障树分析法。可通过树形图对潜油电泵工作情况进行判断,了解潜油电泵的工作原理与现场运行数据,罗列出潜油电泵各个部件可能存在故障问题的概率,绘制树形图,通过计算与定量分析等方式判断潜油电泵是否存在故障[2]。(2)模拟数学分析法。利用模糊矩阵分析潜油电泵出现故障的概率,并得出故障集合[3]。(3)神经网络分析法。在对潜油电泵进行故障诊断时,将潜油电泵故障特征值输入至神经网络模型之中,通过输出值明确潜油电泵的故障类型[4]

      相比于陆地油田,海上油田潜油电泵的故障诊断难度更高。原因如下:(1)海洋环境复杂,信号信噪比低,高噪干扰下会导致部分陆地诊断方法的现场可靠性和有效性降低;超参数过多的算法所训练的模型在信噪比低的环境中需要耗费大量人力进行超参数选择、调节与维护;伴随着数据完善、故障种类增加而来的是繁重的超参数调节工作以及大量算法更新时间,不利于现场应用与实施[5]。因此,尽量少的超参数调节对于海上平台潜油电泵故障诊断算法来说是十分必要的。(2)海上油田潜油电泵数据测量难度较高,无法对各种工况进行有效测试。现阶段海上油田潜油电泵数据主要来源于电泵伴侣[6],所测量参数种类固定,数据质量一般,得到的数据中伴随着大量的缺失数据、无标签数据以及由于工人操作造成的异常数据。部分在其他领域成熟、广泛应用的算法无法在海上油田潜油电泵故障诊断中发挥应有的作用[7]。(3)我国海上油田潜油电泵故障诊断研究起步较晚,数据积累较少,潜油电泵故障种类繁多,一种故障只有几百、几千采样点的数据量十分常见,大量故障数据由于故障发生时诊断条件受限、诊断方法不成熟,没有进行故障分类,成为了无标签数据[8]。用常规监督学习方法来考虑潜油电泵故障诊断问题,不但诊断准确率较低,而且造成了大量正常数据以及无标签数据的浪费,因此无监督学习以及半监督学习方法对于海上油田潜油电泵的故障诊断更加必要且高效。

    • 传统的无监督学习算法,如稀疏自编码、受限Boltzmann机等,大多试图建立真实数据分布的近似模型[9]。尽管这些方法可以在某些情况下得到良好的数据特征,但它们的特征提取效果很大程度上受到参数调整好坏的影响,灵活性较差。2011年,斯坦福大学的Andrew等提出了一种新的无监督两层学习算法,即稀疏滤波[10]。其核心思想是避免数据分布的显式建模,利用稀疏性的自动特征选择以及可解释性等优点,通过直接优化特征分布的稀疏性得到更好的特征表示。通常来说,稀疏滤波只需要调整一个参数,即学习特征的个数,就可以处理高维数据[11]。稀疏滤波方法致力于满足以下3个特性的良好特征:(1)种群稀疏。该特性要求数据中每个样本特征是稀疏的,具体表现为每个样本只通过少量特征来表示,即特征分布矩阵中每列只有少数项是非0值,大多数项均为0值项。(2)存在稀疏。该特性要求数据样本每个特征都是稀疏的,具体表现为每个特征所表示的样本数量要尽可能少,即特征分布矩阵的每行只有几个非0值项,大部分都应是0值项。(3)高扩散。该特性要求每个特征在不同的数据样本中应具有相似的统计特征,即特征分布矩阵的每一个行向量的特征分布需要较为相似。

      稀疏滤波方法本质是一个双层结构的神经网络,稀疏滤波的网络结构如图1所示。

      图  1  稀疏滤波网络结构

      Figure 1.  Sparse filtering network structure

      给定信号数据为$ \boldsymbol{X}=[{x}^{1},{x}^{2},\cdots ,{x}^{i},\cdots ,{x}^{M}] $,其中$ {x}^{i}\in {\mathfrak{R}}^{N\times 1} $表示数据长度为N的第$ i $组信号,M为信号的样本数。对信号进行特征提取,假设L为需要学习的特征个数,即特征矩阵$ \boldsymbol{F}\in {\mathfrak{R}}^{L\times M} $,信号$ {x}^{i} $所对应的特征向量$ {f}^{i} $通过权重矩阵$ \boldsymbol{W}\in {\mathfrak{R}}^{N\times L} $所得,特征矩阵$ \boldsymbol{F} $表示如下。

      $$ \boldsymbol{F}=\left(\begin{array}{cccc} f_1^1 & f_1^2 & \ldots & f_1^M \\ f_2^1 & f_2^2 & \ldots & f_2^M \\ \vdots & \vdots & \ddots & \vdots \\ f_L^1 & f_L^2 & \ldots & f_L^M \end{array}\right) $$ (1)

      特征矩阵$ \boldsymbol{F} $中元素$ {f}_{j}^i $计算如下。

      $$ {f}_{j}^{i}={\omega }_{j}\times {x}^{i} $$ (2)

      首先考虑稀疏滤波中每个样本都具备线性特征的情况,即

      $$ {f}_{l}^{i}\text={W}_{l}^{\mathrm{T}}{x}^{i} $$ (3)

      其中,$ {f}_{l}^{i} $对应于第$ i $个样本的第$ l $个特征。

      通过$ {l}_{2} $范数的形式将样本按特征进行标准化处理,使每一个特征都可均匀地分布在各个样本中。

      $$ \tilde{f}_l=\dfrac{f_l}{\left\|f_l\right\|_2} $$ (4)

      其中,$ {l}_{p} $范数的形式为

      $$\|t\|_p=\sqrt[p]{\left|t_1\right|^p+\left|t_2\right|^p +\cdots+\left|t_n\right|^p}$$ (5)

      然后,通过$ {l}_{2} $范数对样本中的特征进行标准化处理,使样本的特征映射到样本的$ {l}_{2} $-ball中。

      $$ \hat{f}^i=\dfrac{\tilde{f}^i}{\left\|\tilde{f}^i\right\|_2} $$ (6)

      最后,为了保证元素的稀疏性,即将样本中的大部分元素归零化,通过$ {l}_{1} $惩罚项对标准化特征进行优化。

      $$ {{{\rm{min}}}}\;\sum\limits_{i = 1}^M {{{\left\| {{{\hat f}^i}} \right\|}_1}} = {\sum\limits_{i = 1}^M {\left\| {\dfrac{{{{\tilde f}^i}}}{{{{\left\| {{{\tilde f}^i}} \right\|}_2}}}} \right\|} _1} $$ (7)

      通常采用有限内存拟牛顿法(limited memory BFGS,L-BFGS)对该目标函数进行求解[12]

      上述推导以稀疏滤波中每个样本都具备线性特征为前提条件,实际诊断过程中,样本特征通常表现为非线性特征,因此需要通过激活函数将稀疏滤波扩展为非线性滤波器,引入激活函数$ g (\cdot )=|\cdot | $。将式(7)扩展为

      $$ {f}_{l}^{i}=g\left ({W}_{l}^{\mathrm{T}}{x}^{i}\right)=\sqrt{\varepsilon +{\left ({\omega }_{l}^{\mathrm{T}}{x}^{i}\right)}^{2}} $$ (8)

      实际上激活函数并不局限于绝对值函数,RELU函数、tanh函数、sigmoid函数均可以用于稀疏滤波的非线性激活[13]

    • BFGS算法是由Broyden、Flecher、Goldfarb、Shanno 4位数学家共同提出,因此取4位数学家的首字母进行命名,L-BFGS算法是在BFGS算法基础上减少内存占用,增加计算效率的改进方法[14]

      下面从牛顿法出发,逐步说明该算法的优化过程。

    • 牛顿法用于对无约束非线性函数$ f\left (x\right) $进行优化求解,通过二次函数,对$ f\left (x\right) $进行近似如下。

      $$ \begin{split} & f\left (x\right)\approx f\left ({x}^{\left (k\right)}\right)+{\left (x-{x}^{\left (k\right)}\right)}^{\mathrm{T}}\nabla f\left ({x}^{\left (k\right)}\right)+\\&\qquad \dfrac{1}{2}{\left (x-{x}^{\left (k\right)}\right)}^{\mathrm{T}}{\nabla }^{2}f\left ({x}^{\left (k\right)}\right)\left (x-{x}^{\left (k\right)}\right) \end{split}$$ (9)

      其中,$ {x}^{\left (k\right)} $表示$ f\left (x\right) $$ k $次近似最优解,假设函数$ f\left (x\right) $二阶可微,求解$ f\left (x\right) $的一阶微分。

      $$ \nabla f\left (x\right)\approx \nabla f\left ({x}^{\left (k\right)}\right)+{\nabla }^{2}f\left ({x}^{\left (k\right)}\right)\left (x-{x}^{\left (k\right)}\right) $$ (10)

      $ \nabla f\left (x\right)=0 $,得到$ {x}^{\left (k\right)} $的迭代求解公式如下。

      $$ {x}^{(k+1)}={x}^{\left (k\right)}-{\left[{\nabla }^{2}f\left ({x}^{\left (k\right)}\right)\right]}^{-1}\nabla f\left ({x}^{\left (k\right)}\right) $$ (11)
    • 拟牛顿法在求解过程中,将牛顿法中难以计算逆矩阵$ {\left[{\nabla }^{2}f\left ({x}^{\left (k\right)}\right)\right]}^{-1} $替换成近似矩阵${H}_{k}$,以实现简化计算的目的,拟牛顿法的迭代公式如下。

      $$ {x}^{(k+1)}={x}^{\left (k\right)}-{t}_{k}{H}_{k}\nabla f\left ({x}^{\left (k\right)}\right) $$ (12)

      其中,$ {t}_{k} $为矩阵搜索步长,拟牛顿法的近似矩阵$ {H}_{k} $需要满足以下3条约束条件,即$ {H}_{k} $需要满足正定性、可迭代性、拟牛顿条件。

      $$ \nabla f{\left ({x}^{\left (k\right)}\right)}^{\mathrm{T}}{H}_{k}\nabla f\left ({x}^{\left (k\right)}\right) > 0 $$ (13)
      $$ {H}_{k+1}={H}_{k}+\mathrm{\Delta }{H}_{k} $$ (14)
      $$ {H}_{k+1}\left [\nabla f\left ({x}^{(k+1)}\right)-\nabla f\left ({x}^{\left (k\right)}\right)\right]={x}^{(k+1)}-{x}^{\left (k\right)} $$ (15)

      将式(14)代入到式(15)中,可以得到

      $$\begin{split} & \mathrm{\Delta }{H}_{k}\left [\nabla f\left ({x}^{(k+1)}\right)-\nabla f\left ({x}^{\left (k\right)}\right)\right]={x}^{(k+1)}-{x}^{\left (k\right)}-\\&\qquad\quad {H}_{k}\left [\nabla f\left ({x}^{(k+1)}\right)-\nabla f\left ({x}^{\left (k\right)}\right)\right] \end{split} $$ (16)

      $ \mathrm{\Delta }{g}_{k}=\nabla f\left ({x}^{(k+1)}\right)-\nabla f\left ({x}^{\left (k\right)}\right),\mathrm{\Delta }{x}^{\left (k\right)}={x}^{(k+1)}-{x}^{\left (k\right)} $,则式(16)可以改写为

      $$ \mathrm{\Delta }{H}_{k}\mathrm{\Delta }{g}_{k}=\mathrm{\Delta }{x}^{\left (k\right)}-{H}_{k}\mathrm{\Delta }{g}_{k} $$ (17)

      其中,校正矩阵$ \mathrm{\Delta }{H}_{k} $为BFGS算法的主要目标函数,通过选取$ \mathrm{\Delta }{H}_{k} $得到所需的迭代函数。

    • 为使$ {H}_{k} $满足上文中所提的约束条件,引入两个向量$ {{\boldsymbol{u}}}_{{k}} $$ {{\boldsymbol{v}}}_{k} $,其表达式如下。

      $$ \begin{array}{c}{u}_{{k}}=\dfrac{\mathrm{\Delta }{x}_{k}}{\mathrm{\Delta }{x}_{k}^{{\rm{T}}}\mathrm{\Delta }{g}_{k}}\left (1+\dfrac{\mathrm{\Delta }{g}_{k}^{\mathrm{T}}{H}_{k}\mathrm{\Delta }{g}_{k}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\right)-\dfrac{{H}_{k}\mathrm{\Delta }{g}_{k}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\\ {v}_{{k}}=\dfrac{\mathrm{\Delta }{x}_{k}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\end{array} $$ (18)

      通过引入${u}_{{k}}$$ {v}_{k} $,可以将$ \mathrm{\Delta }{H}_{k} $${u}_{{k}}$$ {v}_{k} $改写为

      $$ \mathrm{\Delta }{H}_{k}=\mathrm{\Delta }{x}^{\left (k\right)}{u}_{k}^{\mathrm{T}}-{{H}}_{{k}}\mathrm{\Delta }{g}_{k}{v}_{k}^{\mathrm{T}} $$ (19)

      将式(18)代入式(19)中,得到$ \mathrm{\Delta }{H}_{k} $的表达式如下。

      $$ \mathrm{\Delta }{H}_{k}=\dfrac{\mathrm{\Delta }{x}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\left (1+\dfrac{\mathrm{\Delta }{g}_{k}^{\mathrm{T}}{H}_{k}\mathrm{\Delta }{g}_{k}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\right)-\dfrac{\mathrm{\Delta }{x}_{k}\mathrm{\Delta }{g}_{k}^{\mathrm{T}}{H}_{k}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}-\dfrac{{H}_{k}\mathrm{\Delta }{g}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}} $$ (20)

      将式(19)代入$ {H}_{k+1}={H}_{k}+\mathrm{\Delta }{H}_{k} $中,得到$ {H}_{k+1} $的表达式。

      $$\begin{split} & {H}_{k+1}={H}_{k}+\dfrac{\mathrm{\Delta }{x}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\left (1+\dfrac{\mathrm{\Delta }{g}_{k}^{\mathrm{T}}{H}_{k}\mathrm{\Delta }{g}_{k}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\right)-\dfrac{\mathrm{\Delta }{x}_{k}\mathrm{\Delta }{g}_{k}^{\mathrm{T}}{H}_{k}}{\mathrm{\Delta }{x}_{k}^{T}\mathrm{\Delta }{g}_{k}}-\\& \dfrac{{H}_{k}\mathrm{\Delta }{g}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}} =\left (I-\dfrac{\mathrm{\Delta }{x}_{k}\mathrm{\Delta }{g}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\right){H}_{k}\left (I-\dfrac{\mathrm{\Delta }{g}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}}\right)+\dfrac{\mathrm{\Delta }{x}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}}{\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\mathrm{\Delta }{g}_{k}} \end{split} $$ (21)
    • BFGS算法中$ {H}_{k} $的空间复杂度较高,当利用本文中所用的稀疏滤波算法进行优化时,函数维度较高,计算时占用较高内存,计算效率较低。L-BFGS算法的目的就是对$ {H}_{k+1} $的求解进行优化,其计算公式如下。

      $$ \begin{split} &\qquad\qquad\qquad {H_{k + 1}} = \prod\limits_{p = k}^{k - i} {V_p^{\text{T}}{H_{k - i}}} \prod\limits_{p = k}^{k - i} {{V_p}} +\\& \sum\limits_{j = 0}^m {{\rho _{k - m + j}}\left(\prod\limits_{l = 0}^{m - j - 1} {V_{k - l}^{\text{T}}} \right)\Delta {x_{k - m + j}}\Delta {x^{\text{T}}}_{ k - m + j}{{\left(\prod\limits_{l = 0}^{m - j - 1} {V_{k - l}^{\text{T}}} \right)}^{\text{T}}}} \end{split} $$ (22)
      $$其中\qquad \begin{array}{c}{\rho }_{k}=\dfrac{1}{\mathrm{\Delta }{x}_{k}^{{\rm{T}}}\mathrm{\Delta }{g}_{k}}, {V}_{k}=I-{\rho }_{k}\mathrm{\Delta }{g}_{k}\mathrm{\Delta }{x}_{k}^{\mathrm{T}}\end{array} $$ (23)
    • 稀疏滤波方法作为一种无监督学习方法,其主要优点在于通过极少量的超参数调节,获得具备强可分性的特征[15]。基于稀疏滤波的故障诊断方法流程如图2所示。

      图  2  稀疏滤波故障诊断流程

      Figure 2.  Sparse filtering based fault diagnosis process

    • 稀疏滤波故障诊断流程本质上是一个两阶段的神经网络,该网络由雷亚国教授所提出[16],采用了均化思想对稀疏滤波过程进行了简化,并通过softmax分类器对所得到的信号特征进行模式识别,实现信号的故障诊断。该方法通过均化的形式,所能得到的特征更为丰富,又对信号特征提取过程中产生的误差值以及非显著特征进行了稀释,增强了信号的显著特征,能够更好地得到信号的稀疏表征。传统稀疏滤波方法得到的信号特征与均化后特征对比如图3所示。图3中所采用的信号维度$ {N}_{\mathrm{i}\mathrm{n}} $=1 200,输出特征维度$ {N}_{\mathrm{o}\mathrm{u}\mathrm{t}} $=300。图3(a)为将信号均化后的稀疏滤波输出图,实际输入维度$ {N}_{\mathrm{i}\mathrm{n}} $=200,输出结果为6次随机输入的均值所得;图3(b)为直接将1 200维信号进行训练的结果。由图3可以看出,特征均化后,经过稀疏滤波的信号具备了更丰富的信号特征,可以得到更好的效果,后续将对均化过程进行对比分析。

      图  3  稀疏滤波特征均化前后对比

      Figure 3.  Characteristics comparison of sparse filtering before and after homogenization

      假设数据集为$ {\left\{{x}^{i}\right\}}_{i=1}^{M} $,该数据集包含M个样本,数据集对应的标签为$ {\left\{{y}^{i}\right\}}_{i=1}^{M} $,其中,数据集中每一个样本都包含N个数据点,即$ {x}^{i}\in {\mathfrak{R}}^{N\times 1} $,所对应的标签$ {y}^{i}=\left\{\mathrm{1,2},\cdots ,K\right\} $K表示工况种类。

      首先,对数据集进行随机采样,假设随机进行$ J $次采样,令实际输入维度$ {N}_{\mathrm{i}\mathrm{n}}=\dfrac{N}{J} $,信号$ {x}^{i} $所得到的稀疏滤波结果如下。

      $$ {f^i} = \left ( {f_1^i,f_2^i, \cdots ,f_J^i} \right) $$ (24)

      将所得到的结果进行均化处理,得到的就是$ {x}^{i} $所对应的均化稀疏滤波特征。

      $$ {f^i} = {\left ( {\dfrac{1}{J}\sum\limits_{j = 1}^J {f_j^i} } \right)^{\text{T}}} $$ (25)
    • 通过稀疏滤波得到均化稀疏滤波之后,需要对不同的故障模式进行分类,以实现故障诊断的目的。对于所得到的稀疏特征,机器学习中的常用分类器,例如卷积神经网络或者核极限学习机[17],需要调节的超参数较多,违背了稀疏滤波方法理论的初衷,且无法对所得到的特征进行有效放大。因此,通过Softmax分类器对所得到的特征进行训练与分类,Softmax分类器本质上是一种单层神经网络,通过概率的e指数形式对所得到的显著特征进一步放大处理,并最终映射到样本对应的标签。Softmax的假设函数$ {h}_{\theta }\left ({x}^{i}\right) $定义如下[18]

      $$ {h_\theta }\left ( {{x^i}} \right) = \left[ {\begin{array}{*{20}{c}} {p\left ( {{y^i} = 1} \right.|\left. {{x^i};\theta } \right)} \\ {p\left ( {{y^i} = 2} \right.|\left. {{x^i};\theta } \right)} \\ {\begin{array}{*{20}{c}} \vdots \\ {p\left ( {{y^i} = K\mid {x^i};\theta } \right)} \end{array}} \end{array}} \right] = \dfrac{1}{{ \displaystyle\sum\limits_{k = 1}^K {{{\rm{e}}^{\theta _k^{\text{T}}{x^i}}}} }}\left[ {\begin{array}{*{20}{c}} {{{\rm{e}}^{\theta _1^{\text{T}}{x^i}}}} \\ {{{\rm{e}}^{\theta _2^{\text{T}}{x^i}}}} \\ \vdots \\ {{{\rm{e}}^{\theta _K^{\text{T}}{x^i}}}} \end{array}} \right] $$ (26)

      其中,$ \theta ={\left[{\theta }_{1},{\theta }_{2},\cdots ,{\theta }_{K}\right]}^{\mathrm{T}} $表示softmax模型的参数,并通过$ \dfrac{1}{ \displaystyle\sum _{k=1}^{K} {{\rm{e}}}^{{\theta }_{k}^{\mathrm{T}}{x}^{i}}} $$ {{\rm{e}}}^{{\theta }_{i}^{\mathrm{T}}{\mathrm{x}}^{i}} $赋予权重,使得所有标签的权重之和为1。通过该方法得到的代价函数$ J\left (\theta \right) $

      $$\begin{split} J (\theta ) =& - \dfrac{1}{m}\left[\sum\limits_{i = 1}^m {(1 - {y^{(i)}})\ln (1 - {h_\theta }({x^{(i)}})) + {y^{(i)}}\ln {h_\theta }({x^{(i)}})} \right] \\ =& - \dfrac{1}{m}\left[\sum\limits_{i = 1}^m {\sum\limits_{j = 0}^K {1\{ {y^{(i)}} = j\} \ln \dfrac{{{{\rm{e}}^{\theta _k^{\text{T}}{x^i}}}}}{{ \displaystyle\sum\limits_{k = 1}^K {{{\rm{e}}^{\theta _l^{\text{T}}{x^i}}}} }}} } \right] \end{split} $$ (27)

      Softmax分类器的训练过程就是最小化代价函数$ J\left (\theta \right) $的过程,通过对代价函数的优化,最终达到分类目的。

    • 电流信号来源于中海油能源发展股份有限公司(渤海油田),分别取10种潜油电泵故障进行分析,具体故障与对应潜油电泵编号如表1所示。

      表 1  渤海油田潜油电泵的故障模式与编号

      Table 1.  ESP fault mode in Bohai Oilfield

      潜油电泵编号故障类型故障发生时间
      XXX9-3-BXX 产液异常降低 2019−06
      XXX9-9-JXX 稠油 2018−08
      XXX9-3-A22SXX 电机故障 2020−03
      XXX9-3-A09SXX 电缆击穿 2019−01
      XXX9-3-E02SXX 流道堵塞 2019−01
      XXX9-3-E09SXX 电气性能故障 2017−03
      XXX9-3-EXX 管柱漏失 2020−11
      XXX9-3-CXX 砂卡 2016−05
      XXX5-6-FXX 乳化 2019−08
      XXX9-3-E20SXX 正常(未发生故障) 2019−09(数据采样时间)

      当潜油电泵发生故障停机时,取停机前24 h的电流数据作为原始数据,原始数据的数据间隔为2 s。对原始数据进行窗口化采样,以1 200个数据为一组,即每组数据代表的时间长度为40 min。对每种工况随机采样400组,10种工况共计4 000组数据。将10%数据作为训练数据集进行训练,90%数据作为测试数据集来对现场情况中有标签数据量较少、无标签数据量较大的数据情况进行模拟。每组数据稀疏滤波算法的输入$ {N}_{\mathrm{i}\mathrm{n}} $为200,输出$ {N}_{\mathrm{o}\mathrm{u}\mathrm{t}} $为100,均化样本数$ J $为6。

      通过t-SNE算法对稀疏滤波算法的结果进行可视化表征。t-SNE算法是一种非线性降维算法,可以强化数据的相似特征,取得更好的聚类效果,并将训练结果通过二维形式体现出来。由图4可得,该故障诊断方法在所诊断的10种工况判断中取得了理想的效果。

      图  4  t-SNE算法对稀疏滤波分类结果的可视化效果图

      Figure 4.  Visual chart of sparse filtering classification result based on t-SNE algorithm

      为了进一步诠释该诊断方法的诊断效果,表2给出了不同工况下诊断结果的混淆矩阵,其中标签0~10分别代表了产液异常降低(0)、稠油(1)、电机故障(2)、电缆击穿(3)、电气性能故障(4)、流道堵塞(5)、管柱漏失(6)、砂卡(7)、乳化(8)、正常(9)。

      表 2  不同工况下的故障诊断准确率结果

      Table 2.  Fault diagnosis accuracy under different working conditions

      实际
      标签
      不同工况故障诊断准确率/%
      0123456789
      095.35502.1862.459000000
      1010000000000
      22.535092.3943.09901.9720000
      3000100000000
      4000095.94204.058000
      50000099.1550.845000
      600000.831099.169000
      7000000010000
      80002.21601.1081.662095.0140
      9000000000100

      表2可知,对于稠油(1)、电缆击穿(3)、砂卡(7)、正常状态(9)这4种情况,诊断准确率都达到了100%,说明在这4种情况下,稀疏滤波方法所得到的特征具备较高的识别度。而对于流道堵塞(5)、管柱漏失(6)这2种故障,诊断准确率也达到了99%以上,这2种故障在传统的电流故障诊断方法中,由于电流的变化较弱,难以取得较好的故障诊断效果,但是所提出的故障诊断算法不通过电流的定性变化,而是通过电流的波动情况来作为特征提取的对象,得到了较好的诊断效果。对于产液异常降低(0)、电机故障(2)、电气性能故障(4)、乳化(8)这4种故障,诊断效果虽不如其他6种工况理想,但依然取得90%以上的诊断准确率。以电机故障为例,该故障在测试时,容易被错误地诊断为产液异常降低(0)、电缆击穿(3)、流道堵塞(5)等,这是因为电机故障对电流的影响过高,进行均化处理时,不仅难以取得更多有效的特征,还会使均化的每一组特征互相影响与干扰,影响故障诊断的准确率。

    • 输出特征维度$ {N}_{\mathrm{o}\mathrm{u}\mathrm{t}} $是标准稀疏滤波过程中唯一需要调节的超参数,输出维度不同不仅影响算法的计算时间,而且影响模式特征提取的效果。不同输出维度下稀疏滤波效果如图5所示,可以看出,输出维度$ {N}_{\mathrm{o}\mathrm{u}\mathrm{t}} $越高,稀疏滤波所得到的特征参数越多,但是随着$ {N}_{\mathrm{o}\mathrm{u}\mathrm{t}} $的增加,系统运算时间也会相应增加。因此实际工程应用时,选取准确率达到一定标准的最小输出维度,更有利于进行应用。

      图  5  不同输出维度下的稀疏滤波效果图

      Figure 5.  Sparse filtering rendering at different output dimensions

      不同输出维度下的准确率和计算时间见图6,其中准确率与计算时间均取5次试验的平均值,误差表示准确率的最大值与准确率平均值之间的差异。由图6可知,当输出维度为100时,稀疏滤波模型诊断准确率达到了95%左右,该维度下计算时间约为53.05 s。随着输出维度增加,故障诊断准确率也随之增加,当输出维度为500时,诊断准确率达到了99.1%,但是现场应用中,受限于设备能够分配的内存限制,因此,越快速诊断越能更好地在现场应用,故选择$ {N}_{\mathrm{o}\mathrm{u}\mathrm{t}} $=100为稀疏滤波模型的默认输出维度。

      图  6  不同输出维度下稀疏滤波算法准确率和计算时间

      Figure 6.  Diagnosis accuracy and calculation time of sparse filtering algorithmat at different output dimensions

    • 均化是一种提高稀疏滤波准确率使稀疏滤波得到更多细节特征的有效处理方式。对均化过程以及输入维度进行对比分析,图7表示不同均化过程算法的准确率情况,图8表示不同输入维度稀疏滤波算法准确度和计算时间。

      图  7  不同均化过程下稀疏滤波算法准确率和计算时间

      Figure 7.  Accuracy and calculation time of sparse filtering algorithm in different homogenization processes

      图7可知,该诊断算法在2均化和6均化时取得了较好的效果,不仅诊断准确率较高,而且训练时间较少。由图8可知,随着输入维度的增加,训练准确率逐渐提高,但对现场电流数据进行采样时,2 s采样间隔下,250输入维度下需要对1 200个电流数据进行采样,采样时间为50 min,对故障反应具备一定的延后性。因此现场应用时,输入维度也不宜过高,以避免失去实时诊断能力。

      图  8  不同输入维度下稀疏滤波算法准确率和计算时间

      Figure 8.  Accuracy and calculation time of sparse filtering algorithm at different input dimensions

    • 现场数据往往只存在非常少量的标签数据。因此,出于现场应用考虑,衡量算法的重要条件是如何在较低的训练样本百分比条件下,对模型进行有效训练。图9给出不同训练样本百分比条件下模型训练时间与模型准确率,可以看出,当训练数据比例为10%或以上时,采用稀疏滤波算法即可得到较好的训练效果,将会更接近真实现场情况,即训练数据占比更低的情况进行讨论。

      图  9  不同训练数据占比下稀疏滤波算法准确率和计算时间

      Figure 9.  Accuracy and calculation time of sparse filtering algorithm at different training data ratios

    • 由于实际诊断过程中,电流数据为非线性数据,所得到特征表现为非线性特征,因此需要通过激活函数将稀疏滤波扩展为非线性滤波器。本文所采用的激活函数为绝对值函数,接下来对所采用的激活函数进行分析。常见的非线性激活函数为绝对值函数、RELU函数、tanh函数、sigmoid函数等。4种激活图像见图10

      图  10  稀疏滤波算法中的激活函数

      Figure 10.  Activation function of sparse filtering algorithm

      分别将4种激活函数作为稀疏滤波算法的激活函数,所得到的诊断准确率如图11所示,可以看出,所有激活函数均取得了不错的故障诊断准确率,绝对值函数作为稀疏滤波的非线性激活函数所得到的故障诊断效果是最理想的。

      图  11  不同激活函数诊断结果

      Figure 11.  Diagnosis results of different activation functions

    • 为评价本文所提算法对潜油电泵电流信号特征提取的效果,将其算法与近年潜油电泵电流算法进行了对比分析。表3为本文方法与其他潜油电泵故障诊断方法的对比,即分别通过对电流卡片阈值模板进行诊断,通过特征BP神经网络对电流卡片进行诊断,通过极限学习机进行模式识别,通过K近邻、随机森林、支持向量机的综合诊断模型,双层分类器的故障诊断,多算法融合的潜油电泵故障诊断方法[19-20]。分别从故障诊断准确率,是否可以进行在线诊断以及可诊断工况种类进行说明。

      表 3  不同诊断方法对比

      Table 3.  Comparison between different diagnosis methods

      方法诊断准确率/%是否在线诊断诊断工况数
      电流卡片阈值法87.510
      BP神经网络926
      极限学习机95.75
      KNN、RF、SVM975
      多分类器91.835
      多算法融合94.915
      稀疏滤波99.110

      表3可知,基于稀疏滤波的潜油电泵参数特征提取方法故障诊断准确率可以达到99.1%,在所有故障诊断方法中最高,说明该方法得到了较为理想的电流信号特征。同时,所提出的方法在诊断样本数量上也有较为明显的优势,除了无法进行在线诊断的电流卡片法之外,稀疏滤波方法可以诊断最多的工况类型,因此有更为理想的现场应用效果。

    • 本文提出了一种基于稀疏滤波的潜油电泵电流信号故障诊断方法,利用渤海油田的现场电流数据对所建立的模型进行试验,结果表明,该方法在标签数据量极少的情况下,对电流数据进行有效的特征提取,实现了潜油电泵的10种故障状态的诊断。利用此方法对现场数据进行在线故障诊断,准确率达到99.1%。稀疏滤波方法进行故障诊断时,由于其方法本身的稀疏性,能够更有效地对故障模式进行更新,在数据不断丰富、故障种类不断完善的基础上,其应用潜力仍会不断提升。

参考文献 (20)

目录

    /

    返回文章
    返回