[논문리뷰] Applications of unsupervised deep transfer learning to intelligent fault diagnosis: A survey and comparative study
카테고리: DL Paper
태그: deeplearning paper
Summary
- open source data를 제공하고 transfer learning방법에 대한 성능비교를 한다.
0. Information
-
2022-06-21 기준 24회 인용
-
JCR IF 2020 기준 4.016 (Q1)
-
2021년에 출판된 최신 논문임.
1. Introduction
-
산업과 관련된 빅데이터의 발달과 IoT의 발달로 여러 기계시스템에 대한 PHM의 인기가 점점 증가하고 있다. 예전에는 Machine learning을 통한 진단이 주였지만, 이는 사람이 특징 추출을 하거나 다른 고도의 전처리 기술이 필요로 된다.
-
이용 가능한 데이터의 증가로 data-driven 방법이 점점 더 중요해지고 있다. 딥러닝 기반의 고장진단이 우수하지만, 두가지 가정이 존재해야함.
- 훈련 샘플과 테스트 샘플의 분포가 같아야 한다.
- 충분한 레이블 데이터가 있어야 함.
-
기본적인 딥러닝 모델은 weak generalization ability를 가지고 있음.
-
회전체 기반의 기계들은 힘, 속도와 같이 운행조건이 서로 다른 상태로 돌아가게 됨. 내재되어 있는 유사성 때문에 두개의 도메인에 존재하는 Shared feature는 domain shift를 다룰 수 있음.
- 하지만 target domain에는 레이블이 없는 경우가 다수임. 그래서 이 논문에서는 unsupervied deep transfer learning(UDTL)에 대해 다룸.
UDA(Unsuperviesd Domain Adaptation)과 비슷하지만 본 논문에서는 이를 구분하지 않을 것이다.
-
컴퓨터 분야에서는 open source code와 baseline에 대한 정확도 정보가 많지만 고장진단 분야에서는 그렇지 못함. 사람들은 항상 의심한다. 파라미터 개수가 많아서 정확도가 높은게 아닌 지? - 이러한 문제를 해결해야 한다.
Zheng, Huailiang, et al. “Cross-domain fault diagnosis using knowledge transfer strategy: A review.” Ieee Access 7 (2019): 129260-129290.
-
위의 논문에서 open source data를 제공하고 transfer learning방법에 대한 성능비교를 한다. 하지만 UDTL에 초점을 두고 있지 않다. (Source domain과 Target domain이 같은 분포에 있다.)
-
Main Contibution
- 새로운 분류법 도입
- 데이터를 split하는 방법에 대해 논의한다.
- 여러 UDTL을 평가하고 비교한다. 그리고 backbone에 대한 영향, negative transfer에 대한 영향을 다룬다.
- Open source code를 제공한다. https://github.com/ZhaoZhibin/UDTL/tree/master/datasets
2. Background and definition
A. Defintion of UDTL
- Source 도메인의 데이터 구성과 Target 도메인의 데이터 구성에 대해 설명 (생략)
B. Taxonomy of UDTL-Based IFD
- 그림과 같이 UDTL의 종류를 나눌 수 있다.
-
우선 single domain에 대해 label-consistent(Source와 Target의 레이블이 일치하는 경우)와 label-inconsistent(Source 레이블과 Target 레이블이 일치하지 않는 경우)가 있다.
레이블이 일치한다는 것은 Source에도 정상, 고장1, 고장2가 있으면 Target에도 똑같다. 하지만 일치하지 않는 경우에는 Source에 정상, 고장1, 고장2 가 있고 Target에는 정상, 고장2, 고장3이 있을 수도 있다. (이것에 대해서도 세부적으로 나누는 데 이는 생략하겠다.)
- 그리고 Multi-domain UDTL에 대해서 Multi-domain adaptation과 domain generalization(DG)가 있다. Multi-domain adaptation의 경우에는 Target 데이터에 대해서 unlabeled된 상태로 들어가게 되고, DG의 경우에는 Target data를 학습에 전혀 사용하지 않는다.
C. Motivation of UDTL-Based IFD
- UDTL은 4가지 다른 운행조건을 다룬다. (다른 운행조건, 다른 고장 유형, 다른 고장 위치, 다른 기계)
D. Structure of Backbone
-
이미지 분야에서 다양한 Backbone이 많이 존재한다. (VGG, ResNet 등…)
-
여러 논문에서 다양한 Backbone을 사용하고 있어 정확도에 대해 누가 더 좋은지 알기 어렵다. 논문에서는 CNN구조로 고정을 하였다.
-
이후 글은 양이 방대해서 본인이 관심있는 부분을 읽어주시면 되겠습니다.
Reference
- Zhao, Zhibin, et al. “Applications of unsupervised deep transfer learning to intelligent fault diagnosis: A survey and comparative study.” IEEE Transactions on Instrumentation and Measurement (2021).
댓글남기기