본문 바로가기

728x90
반응형

분류 전체보기

(163)
[네이버 부캠] 프로젝트1: 문장 간 유사도 측정(STS) 대회 정리 네이버 부스트캠프 ai tech 교육 과정에서 총 5번의 프로젝트를 수행한다. 4번의 프로젝트는 캠프에서 주제와 데이터를 제공해줘 AI Stages 플랫폼을 통해 대회 형식으로 진행되고 마지막 프로젝트는 최종 프로젝트로 팀 내에서 기획부터 구현까지 수행하는 걸로 알고 있다. (아직은 최종 프로젝트에 대한 정보가 부족함 ㅎ) 암튼 오늘은 첫 번째 프로젝트를 회고하겠다. CV, NLP, ReySys별로 주제는 다르며, 나는 NLP 과정을 수료중이기 때문에 문장 간 유사도 측정(Semantic Text Similarity; STS)을 주제로 대회를 진행했다. 우리는 public 5위, private 10위로 마무리 했으며(private 6위인데 최종 파일 잘못 제출함ㅜ) 깃허브 레파지토리 주소는 여기다. 1...
[Git] 특정 버전으로 되돌리기 Git을 사용해 협업하다 보면 이전 commit으로 되돌아갔다가 다시 작업을 수행하거나 영영 프로젝트를 되돌려야 할 때가 있다. 그래서 일시적으로 특정 버전으로 되돌아가는 방법과 영구적으로 특정 버전으로 되돌아가는 방법을 공유하려고 한다. 되돌아가기 위해서는 어떤 지점으로 돌아갈 것인지 명시해줘야 하는데 두 가지로 명시 가능하다. 첫 번째는 최근 커밋을 기준으로 숫자를 지정해줘 그 숫자만큼 돌아가는 것이고 두 번째는 commit 해시 코드를 통해 원하는 지점으로 바로 이동하는 것이다. 그래서 첫 번째 방법은 최근으로 돌아갈 때 사용하면 좋고 두 번째 방법은 먼 과거로 돌아갈 때 유용하다. 1. 일시적으로 이전 버전으로 되돌아가기 # 최근에서 n만큼 돌아가기 git checkout head~{n} # 해시..
[알고리즘] 그래프 탐색 기법을 코드로 이해하기 1. 그래프 그래프는 광범위한 분야에서 활용되고 있는 자료구조이다. 그러다보니 코딩테스트 문제 출제 1순위이다. 그래프는 정점과 간선의 집합으로 하나의 간선은 두 개의 정점을 연결한다. 그래프는 G=(V, E)로 표현하는데 간선에 방향이 있는 그래프를 방향그래프, 간선에 방향이 없는 그래프를 무방향그래프라고 한다. V = 정점의 집합, E = 간선의 집합 2. 그래프 탐색 그래프에서는 너비우선탐색(BFS)과 깊이우선탐색(DFS) 방식으로 모든 정점을 방문할 수 있다. 2.0 그래프 코드 G = { 1: set([3, 5]) 2: set([3, 4, 6]), 3: set([1, 2, 6]), 4: set([2]), 5: set([1]), 6: set([2, 3]) } 2.1 BFS BFS는 큐를 사용해 임..
[VSCode] ssh 원격 접속하는 방법 네이버 부스트캠프 ai tech 5기 교육 과정을 이수하면서 AI Stages에서 대회라는 프로젝트를 수행하기 위해 V100 GPU 서버를 제공해주는데 Jupyter lab으로도 접속이 가능하지만, 아무래도 python 프로젝트를 운용하기 위해 ssh로 원격 접속해야 했다. 그래서 기존에 계속 사용하던 IDE인 PyCharm으로 원격 접속해 사용했지만, 핑이 높아 딜레이가 발생하기도 하며 불편함을 느꼇고 킹갓 VSCode는 딜레이 없이 잘 작동해 VSCode로 서버에 원격 접속해 프로젝트를 수행했다. 이 글에서는 VSCode는 설치되어 있다는 가정 하에 VSCode로 ssh 접속하는 방법을 공유하겠다. 1. 확장 프로그램 설치 VSCode [확장] 탭에서 `Remote - SSH`를 다운 받는다. 2. ..
[CS231n] Lecture 4. Backpropagation and Neural Networks Table of contents 1. Introduction 1.1 Forward propagation 1.2 Backward propagation 1.3 computational graph 1.4 chain rule 1.5 Partial Derivative 2. Backward propagation 2.1 Backward propagation 2.2 Gradients for Vector 3. Neural Networks 3.1 Neural Networks 1. Introduction 미분을 통해 최적화를 하는 방법에는 크게 두가지가 있었습니다. Numerical gradient (수치적 미분) : 속도가 느리고 근사치를 찾는 방법임. Analytic gradient (해석적 미분) : 빠르고 정확하지만..
[CS231n] Lecture 8. Deep Learning Software 목차 1. CPU vs GPU 2. Deep Learning Frameworks 2.1 Pytorch 3. Static vs Dynamic Graphs 1. CPU vs GPU CPU와 GPU에 대해 이야기를 하자면 왼쪽 그림은 CPU 칩의 모습이고 오른쪽 그림은 GPU의 모습이다. 위 그래프는 x축은 모델, y축은 연산에 소요된 시간인데 성능이 하드웨어 크기에 비례하는 것인지 GPU(빨, 주)가 CPU(파)보다 훨씬 적은 시간이 소요됐다. 64~76배 차이가 있는데 무조건 GPU를 쓰는게 좋다는 것을 알 수 있다. 강의에서 말하기를 CPU에서는 병목 현상(bottleneck)이 발생할 수 있기 때문에 GPU를 사용하는게 좋고 데이터는 CPU에 저장하며, 모델은 GPU에서 작동하는 것이 좋다고 한다. 2..
[SVM] 서포트 벡터 머신 (Support Vector Machine) 딥러닝이 나오기 이전에 많이 사용되고 좋은 성능을 보여준 서포트 벡터 머신에 대해 리뷰하겠다. 글의 내용은 책 핸즈온 머신러닝을 참고하여 작성했다. 0. SVM이란 SVM(Support Vector Machine)이란, 매우 강력한 머신러닝 알고리즘으로 머신러닝을 배운 사람이라면 반드시 알고 있어야 하는 모델이다. 선형이나 비선형 분류, 회귀, 이상치 탐지에도 사용할 수 있는 다목적 머신러닝 알고리즘으로 특히 분류에서 성능이 뛰어나기 때문에 주로 분류에서 많이 사용된다. 위 그림에서 Separating Hyperplane은 일종의 Decision Boundary 결정 경계이다. Decision Boundary란 분류를 하기 위한 기준 선이라고 생각하면 된다. 지금은 간단한 2-dimension에서의 De..
[CV] Object Detection 검증 지표 Object Detection 문제에서 모델 성능을 평가할 때 단일 레이블이먄 AP(Average Precision)을 사용하고 다중 레이블이면 mAP(mean Average Precision)을 사용한다. mAP는 AP로 계산할 수 있고 AP는 PR 곡선(Precision-Recall Curve)으로 구하며, PR 곡선은 Precision과 Recall으로 구하기 때문에 Object Detection 문제를 해결하는 모델의 성능을 검증하기 위해서 Precision과 Recall을 먼저 알아야 한다. Precision과 Recall을 설명하기 이전에 Confusion Matrix라고 하는 아래 표를 보고 용어를 이해해야 한다. 1. Precision Precision은 정확도를 의미하며 검출 결과 중 올..

728x90
반응형