Deep-Learning/[Vision] 논문 리뷰
-
[Object detection] YOLO v4 논문 리뷰Deep-Learning/[Vision] 논문 리뷰 2021. 6. 28. 11:07
- YOLOv4: Optimal Speed and Accuracy of Object Detection - YOLO 시리즈, 2020년 초에 공개 - Real-time object detection 에서 유명한 시리즈 모델 - 논문: https://arxiv.org/pdf/2004.10934.pdf 요약 몇몇의 feature들은 특정한 모델이나 문제에 국한되어 동작하거나, 소규모 데이터셋에 대해서만 동작한다. 하지만, Object detection을 수행하기 위해서는 universal한 features에 대하여 동작가능해야 한다. 대표적으로 Weighted-Residual-Connections(WRC), Crss-Stage-Partial-Connections(CSP), Cross mini-Batch Nor..
-
[GNN] HFGN 논문 리뷰Deep-Learning/[Vision] 논문 리뷰 2021. 4. 23. 10:28
- Hierarchical Fashion Graph Network for Personalized Outfit Recommendation - X. Li et al. 이 IR 분야의 Top Conf."SIGIR"에서 제안 - GNN을 계층으로 쌓아 User compatibility task를 수행하고자 했음 - 논문: arxiv.org/pdf/2005.12566.pdf 요약 1) 사용자 선호도와의 일관성이라는 두 가지 요구 사항을 충족하기 위해 Fashion compatibility modeling과 맞춤 의상 추천이라는 두 가지 작업을 통합하고자 함 2) User-Outfit, Outfit-Item 간의 관계를 동시에 모델링하는 프레임워크 HFGN을 제안 3) 이전에 리뷰한 NGNN(kuklife.tist..
-
[GNN] NGNN 논문 리뷰Deep-Learning/[Vision] 논문 리뷰 2021. 4. 5. 16:02
- Dressing as a Whole: Outfit Compatibility Learning Based on Node-wise Graph Neural Networks - 해당 논문은 2019년에 "Zeyu Cui et al."이 제안 - 출판한지 2년이 지났음에도 Polyvore task(Recommendation task)에서 SOTA를 기록 링크: dl.acm.org/doi/pdf/10.1145/3308558.3313444 Dressing as a Whole: Outfit Compatibility Learning Based on Node-wise Graph Neural Networks | The World Wide Web Conference ABSTRACT With the rapid developm..
-
[GAN] Pixel-Level Domain Transfer(DTGAN) 논문 리뷰Deep-Learning/[Vision] 논문 리뷰 2020. 8. 6. 17:41
논문: https://arxiv.org/pdf/1603.07442.pdf ※ 참고로 위 논문은 2016년 논문 1. Abstract 위 논문에서 제시하는 모델은 input domain을 semantic level의 target domain으로 전송하고, pixel level의 target image를 생성한다. 실제 target image를 생성하기 위해 real/fake discriminator(GAN)를 사용했을 뿐만 아니라, 생성된 이미지를 입력 이미지와 관련시키기 위해 새로운 domain transfer를 도입시켰다. 2. 서론 이 논문의 연구 배경은 옷장 앞에서 무엇을 입으면 좋을지 옷걸이에 걸린 옷을 보고 자신의 이미지를 두뇌로 상상하는데에서 시작됐다. 즉, 논문의 초점은 딥러닝을 활용하여 시..
-
[Inpainting] Context Encoder(CE) 원리Deep-Learning/[Vision] 논문 리뷰 2020. 5. 26. 01:44
논문 : arxiv.org/pdf/1604.07379.pdf 1. Image inpainting이란? 영상 인페인팅(image inpainting)은 영상에서 훼손된 부분을 복원하거나 영상 내의 불필요한 문자나 특정 물체를 제거한 후 삭제된 영역을 자연스럽게 채우기 위해 널리 사용되는 기법이다. 쉽게 말해, 이미지의 일부분이 누락되어있어도 사람은 비워져있는 부분을 유추할 수 있기에 이를 아래 사진과 같이 "딥러닝 기술을 응용하여 복원하겠다." 라는 의미이다. 2. Image inpainting 기법 - CE(Context Encoder) 1) Intro(조금 더 자세히) 논문에서 제안하는 context encoder는 context 기반의 픽셀 예측을 통해 비지도 학습된 이미지 학습 알고리즘이다. Aut..