SlideShare a Scribd company logo
Structure of Model and Task
#cliche #state-of-the-Art #goal
배지연
Contents
1. Intro
2. Computer Vision
3. Review
4. Representation of Model
2
1. Intro
3
P stage Routine
>> EDA → Model Search
→ Experiment → Ensemble
다양한 성능 좋은 모델을 앙상블함으로써 일반화 성능을 높인다
4
Semantic Segmentation Competition
Backbone 대입 시 성능 향상 Backbone 대입 시 성능 하락
5
As a Result
왜 성능이 좋지 않을까?
== 왜 다른 과제에서는 좋은 성능을 보였던 모델이
이 과제에는 적합하지 않을까?
2. Computer Vision
6
사람의 시각을 모방하다 ≒ 시각 정보를 인식하다
feature map으로 표현되는 정보를 저장하고 전달하는 과정
그림 © NAVER CONNECT Foundation
Train
그림 © NAVER CONNECT Foundation
7
Bias / Specific
모델의 성능을 향상하다
>> 모델의 정보에 대한 반응을 넓히다
>> 시각의 보편적인 특징(color, shape, texture)을 반영한다
>> 인간의 시각을 모방하다
Task Metric에서의 성능을 향상하다
>>>> color, texture bias를 줄이고 shape bias를 늘리다
3. Review
8
그림 © NAVER CONNECT Foundation
Object Detection Semantic Segmentation
>> mAP50 >> mIoU
9
CNN
[https://arxiv.org/abs/1512.03385]
Convolution과 Sub Sampling을 반복하여 Feature을 찾고 연결하는 구조
ResNet
Skip Connection Bottle Neck
10
RNN
Sequential data를 입력으로 받기 위해 과거의 정보를 요약하는 hidden state를 포함하는 구조
그림 © NAVER CONNECT Foundation
>> RNN은 입력 데이터가 일부 탈락되거나 순서가 바뀌면 모델이 처리하기 어려움
>> vanishing/ exploding gradient issue
11
Vision Transformer
[https://openreview.net/forum?id=YicbFdNTTy]
12
Object Detection
전체로부터 Object의 영역을 찾고 해당 영역을 classification
>> Receptive field와 object가 어디에 존재하는지 판단하는 것이 중요
Fast R-CNN (2-stage Detector)
그림 © NAVER CONNECT Foundation
13
Object Detection
YOLO (1-stage Detector)
그림 © NAVER CONNECT Foundation
14
Semantic Segmentation
Pixcel 단위로 각 픽셀이 속하는 Object의 classification
>> Receptive field와 object를 복원하는 성능이 중요
DeepLabv3
그림 © NAVER CONNECT Foundation
15
Semantic Segmentation
U-Net
그림 © NAVER CONNECT Foundation
4. Representation of Model
16
>> Visualization
>> Diagnosis
>> Disentangling
>> Interpretation
>> Evaluation metric
>> For middle-to-end Learning
[Visual Interpretability for Deep Learning : a Survey]
모델을 표현하는 6가지 관점
도표가 제시하는 해석 방향성을 참고하여 모델의 이해 및 활용 방법을 찾을 수 있다
17
Diagnosis
1 Analyze CNN feature from a global view
>> filter의 의미와 전달력을 분석
2 Extracts image regions that directly contribute the network output
>> network output에 가장 민감하게 반응한 이미지 영역을 추출
3 The estimation of vulnerable points in the feature space
>> feature space의 bias를 진단하고 추정
4 Refine network representations based on the analysis of network feature spaces
>> 학습한 model이 놓친 부분을 찾기
5 Discover potential, biased representations
[Visual Interpretability for Deep Learning : a Survey]
18
Disentangling
각 filter로부터 시각 정보가 어떻게 연결되는지 파악하기 위한 질문
[Visual Interpretability for Deep Learning : a Survey]
Q. 각 filter는 얼마나 많은 정보를 외우고 있는가?
Q. 해당 패턴이 특정 영역이나 질감을 설명할 수 있는가?
Q. 공동으로 활성화된 패턴의 관계는 어떠한가?
Q. 개체를 설명하기 위해서 어떤 패턴이 활성화 되는가?
감사합니다
19

More Related Content

Similar to [부스트캠프 Tech Talk] 배지연_Structure of Model and Task (20)

PDF
스마트폰 위의 딥러닝
NAVER Engineering
 
PPTX
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
ssuser20022f
 
PDF
파이썬으로 익히는 딥러닝 기본 (18년)
SK(주) C&C - 강병호
 
PDF
iOS Architecture.pdf
ssuser86e2971
 
PDF
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
Bong-Ho Lee
 
PDF
100만 달러짜리 빠른앱 만드는 비법
SooHwan Ok
 
PDF
200819 NAVER TECH CONCERT 01_100만 달러짜리 빠른 앱을 만드는 비법 전수
NAVER Engineering
 
PPTX
The Cucumber for Java
Jonghwa Lee
 
PPTX
산학 제출 PPT
21HG020
 
PDF
소프트웨어 마에스트로 10기 - 책을 만나는 순간, 책을찍다
HYEONGNAM LEE
 
PDF
Achieving human parity on visual question answering alicemind
taeseon ryu
 
PDF
Refinenet
오 혜린
 
PPT
[강의] OOP 개요
Nohyun Kee
 
PPTX
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
태엽 김
 
PDF
Software defect prediction: do different classifiers find the same defects?
Jeongwhan Choi
 
PPTX
Sw개발 hw제작설계서 임베부스러기
21HG020
 
PPTX
Vip detection sensor
chs71
 
PDF
딥뉴럴넷 클러스터링 실패기
Myeongju Kim
 
PDF
UNUS Big Data BEANs 소개서
영민 최
 
PPTX
Codex project
Lee Jungpyo
 
스마트폰 위의 딥러닝
NAVER Engineering
 
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
ssuser20022f
 
파이썬으로 익히는 딥러닝 기본 (18년)
SK(주) C&C - 강병호
 
iOS Architecture.pdf
ssuser86e2971
 
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
Bong-Ho Lee
 
100만 달러짜리 빠른앱 만드는 비법
SooHwan Ok
 
200819 NAVER TECH CONCERT 01_100만 달러짜리 빠른 앱을 만드는 비법 전수
NAVER Engineering
 
The Cucumber for Java
Jonghwa Lee
 
산학 제출 PPT
21HG020
 
소프트웨어 마에스트로 10기 - 책을 만나는 순간, 책을찍다
HYEONGNAM LEE
 
Achieving human parity on visual question answering alicemind
taeseon ryu
 
Refinenet
오 혜린
 
[강의] OOP 개요
Nohyun Kee
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
태엽 김
 
Software defect prediction: do different classifiers find the same defects?
Jeongwhan Choi
 
Sw개발 hw제작설계서 임베부스러기
21HG020
 
Vip detection sensor
chs71
 
딥뉴럴넷 클러스터링 실패기
Myeongju Kim
 
UNUS Big Data BEANs 소개서
영민 최
 
Codex project
Lee Jungpyo
 

More from CONNECT FOUNDATION (20)

PDF
부스트캠프 웹・모바일 8기 설명회 (2023년)
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
CONNECT FOUNDATION
 
PPTX
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
CONNECT FOUNDATION
 
PDF
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
CONNECT FOUNDATION
 
PDF
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
CONNECT FOUNDATION
 
PDF
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
CONNECT FOUNDATION
 
PDF
부스트캠프 웹∙모바일 7기 설명회
CONNECT FOUNDATION
 
PDF
[부스트캠프 Tech Talk] 신원지_Wandb Visualization
CONNECT FOUNDATION
 
PDF
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
CONNECT FOUNDATION
 
PDF
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
CONNECT FOUNDATION
 
PDF
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
CONNECT FOUNDATION
 
PDF
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
CONNECT FOUNDATION
 
PDF
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기
CONNECT FOUNDATION
 
부스트캠프 웹・모바일 8기 설명회 (2023년)
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
CONNECT FOUNDATION
 
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
CONNECT FOUNDATION
 
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
CONNECT FOUNDATION
 
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
CONNECT FOUNDATION
 
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
CONNECT FOUNDATION
 
부스트캠프 웹∙모바일 7기 설명회
CONNECT FOUNDATION
 
[부스트캠프 Tech Talk] 신원지_Wandb Visualization
CONNECT FOUNDATION
 
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
CONNECT FOUNDATION
 
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
CONNECT FOUNDATION
 
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
CONNECT FOUNDATION
 
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
CONNECT FOUNDATION
 
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기
CONNECT FOUNDATION
 
Ad

[부스트캠프 Tech Talk] 배지연_Structure of Model and Task

  • 1. Structure of Model and Task #cliche #state-of-the-Art #goal 배지연
  • 2. Contents 1. Intro 2. Computer Vision 3. Review 4. Representation of Model 2
  • 3. 1. Intro 3 P stage Routine >> EDA → Model Search → Experiment → Ensemble 다양한 성능 좋은 모델을 앙상블함으로써 일반화 성능을 높인다
  • 4. 4 Semantic Segmentation Competition Backbone 대입 시 성능 향상 Backbone 대입 시 성능 하락
  • 5. 5 As a Result 왜 성능이 좋지 않을까? == 왜 다른 과제에서는 좋은 성능을 보였던 모델이 이 과제에는 적합하지 않을까?
  • 6. 2. Computer Vision 6 사람의 시각을 모방하다 ≒ 시각 정보를 인식하다 feature map으로 표현되는 정보를 저장하고 전달하는 과정 그림 © NAVER CONNECT Foundation Train 그림 © NAVER CONNECT Foundation
  • 7. 7 Bias / Specific 모델의 성능을 향상하다 >> 모델의 정보에 대한 반응을 넓히다 >> 시각의 보편적인 특징(color, shape, texture)을 반영한다 >> 인간의 시각을 모방하다 Task Metric에서의 성능을 향상하다 >>>> color, texture bias를 줄이고 shape bias를 늘리다
  • 8. 3. Review 8 그림 © NAVER CONNECT Foundation Object Detection Semantic Segmentation >> mAP50 >> mIoU
  • 9. 9 CNN [https://arxiv.org/abs/1512.03385] Convolution과 Sub Sampling을 반복하여 Feature을 찾고 연결하는 구조 ResNet Skip Connection Bottle Neck
  • 10. 10 RNN Sequential data를 입력으로 받기 위해 과거의 정보를 요약하는 hidden state를 포함하는 구조 그림 © NAVER CONNECT Foundation >> RNN은 입력 데이터가 일부 탈락되거나 순서가 바뀌면 모델이 처리하기 어려움 >> vanishing/ exploding gradient issue
  • 12. 12 Object Detection 전체로부터 Object의 영역을 찾고 해당 영역을 classification >> Receptive field와 object가 어디에 존재하는지 판단하는 것이 중요 Fast R-CNN (2-stage Detector) 그림 © NAVER CONNECT Foundation
  • 13. 13 Object Detection YOLO (1-stage Detector) 그림 © NAVER CONNECT Foundation
  • 14. 14 Semantic Segmentation Pixcel 단위로 각 픽셀이 속하는 Object의 classification >> Receptive field와 object를 복원하는 성능이 중요 DeepLabv3 그림 © NAVER CONNECT Foundation
  • 15. 15 Semantic Segmentation U-Net 그림 © NAVER CONNECT Foundation
  • 16. 4. Representation of Model 16 >> Visualization >> Diagnosis >> Disentangling >> Interpretation >> Evaluation metric >> For middle-to-end Learning [Visual Interpretability for Deep Learning : a Survey] 모델을 표현하는 6가지 관점 도표가 제시하는 해석 방향성을 참고하여 모델의 이해 및 활용 방법을 찾을 수 있다
  • 17. 17 Diagnosis 1 Analyze CNN feature from a global view >> filter의 의미와 전달력을 분석 2 Extracts image regions that directly contribute the network output >> network output에 가장 민감하게 반응한 이미지 영역을 추출 3 The estimation of vulnerable points in the feature space >> feature space의 bias를 진단하고 추정 4 Refine network representations based on the analysis of network feature spaces >> 학습한 model이 놓친 부분을 찾기 5 Discover potential, biased representations [Visual Interpretability for Deep Learning : a Survey]
  • 18. 18 Disentangling 각 filter로부터 시각 정보가 어떻게 연결되는지 파악하기 위한 질문 [Visual Interpretability for Deep Learning : a Survey] Q. 각 filter는 얼마나 많은 정보를 외우고 있는가? Q. 해당 패턴이 특정 영역이나 질감을 설명할 수 있는가? Q. 공동으로 활성화된 패턴의 관계는 어떠한가? Q. 개체를 설명하기 위해서 어떤 패턴이 활성화 되는가?