본문 바로가기

728x90

전체 글

(163)

[Git] git status 후 한글 깨지는 문제 1. 에러명 git status 2. 문제 git status 입력 후에 빨간 글씨로 commit 가능한 파일 목록을 볼 수 있는데 이 설정을 해주지 않으면 영어는 정상적으로 보이지만, 한글은 \123\12412 등 숫자로 보인다. 큰 바이트를 가진 문자가 unusal 케이스로 포함되어 파일명이 깨진다. 그래서 한글을 unusal 케이스로 인식되지 않게 하려면 다음 명령어로 git 설정을 수행하면 된다. 3. 해결 방법 git config --global core.quotepath false

[Slack] 리마인더 봇 350% 활용하기 네이버 부스트캠프 ai tech 과정을 밟으면서 Slack을 가장 많이 사용하는 중인데 반복적인 이벤트를 항상 말하려고 하다 보니 서로 피곤하다. 그래서 리마인더 기능이 없을까 찾아보다가 Slackbot에서 기본적으로 remind 기능을 제공하고 있다. 공식 문서가 있지만 불친절하기 때문에 remind에 대해 자세히 알아 본 후에 업무 효율을 350% 향상시키자. 1. 기본 명령어 /remind [yourself or #channel] [what] [when] Slack 고객 센터에 있는 내용을 그대로 가져왔지만, 불친절하기 때문에 참고할만 하진 않다. 우선 풀이를 하자면 [yourself or #channel]은 멤버 혹은 채널을 명시해 누구에게 리마인드 해줄 지 선언한다. [what]은 메시지 내용으..

[DART] 공시대상회사 정보 가져오기 대한민국 전자공시시스템(DART : Data Analysis, Retrieval and Transfer System)은 상장법인 등이 공시서류를 인터넷으로 제출하고, 투자자 등 이용자는 제출 즉시 인터넷을 통해 조회할 수 있도록 하는 종합적 기업공시 시스템이다. 웹 사이트에 접속해 검색이 가능하지만 좀 더 방대한 자료를 원한다면 DART에서 API를 제공하기 때문에 python 코드로 손쉽게 구현 가능하다. Open API Key는 여기에서 받으면 되고, 일일 호출 2만 회로 제한되어 있다. 다양한 API를 제공하기 때문에 원하는 정보를 손쉽게 가져올 수 있지만, 우선적으로 작업해야 하는 것이 있다. 그건 기업 정보를 가지고 있어야 해당 기업 검색이 가능한데 [개발 가이드] > [공시 정보] > [4. ..

[Python] 백준 18870번, 좌표 압축 1. 알고리즘 여기를 클릭하면 문제를 확인할 수 있다. 문제에 따르면 원본 데이터에서 중복되는 수를 없애고 숫자가 작은 순서대로 번호를 매겨 저장한 압축 데이터를 생성한다. 그런 다음에 원본 데이터의 값들을 압축 데이터에 있는 값으로 변환해 출력해주면 된다. 2. 코드 import sys IN = sys.stdin.readline if __name__ == "__main__": N = int(IN()) arr = list(map(int, IN().split())) sort_arr = sorted(set(arr)) # 중복된 수 제거 후 정렬 dic = {sort_arr[i]: i for i in range(len(sort_arr))} # 좌표 압축 사전화 s = "" # 문자열로 연결 for i in a..

[Wandb] 손쉽게 실험 결과 기록 및 실험 환경 보존 딥러닝 실험을 진행하다 보면 학습이 잘 되는지 안 되는지 중간중간 모니터링 할 필요가 있다. 그래서 텐서 대시보드 등 다양한 툴이 존재하는데 이번 STS 대회를 진행하면서 Wandb(Weight & Biases)를 사용해봤는데 매우 유용한 툴이다. 개인용으로는 무료로 사용할 수 있어 접근성 또한 편리하며 협업하기 매우 쉽다. 우선 여기에서 회원가입을 진행하자. 또한, pytorch lightning 라이브러리랑 연결해서 사용하는 방법을 공유하겠다. 1. Wandb 설치 pip install wandb 2. 코드 작성 import wandb import pytorch_lightning as pl # wandb 설정 wandb.init(name='{실험명}', project='{프로젝트 이름}', entit..

[Streamlit] 손쉽게 프로토타입 만들기 인공지능 프로젝트를 진행하다가 마무리 단계에 도달아면 결국에는 웹이든 앱이든 실행 가능한 곳에 올려놔야 다른 사람에게 보여줄 수 있다. 즉, 프로토타입이 있어야 공모전에 나가든 대회를 나가든 다른 사람한테 이야기 할 수 있다. 그래서 네이버 부스트캠프 ai tech에서 구인구팀 할 때 플랫폼 개발이 가능한 사람은 좀 더 이익을 본다. 물론 나도 컴퓨터공학과 소프트웨어공학 출신으로 대부분의 인공지능 프로젝트에서 마지막 프로토타입 개발을 수행하는 역할을 맡았다. 근데 이게 은근 시간을 많이 잡아 먹고 내가 결국에는 플랫폼 개발을 하려고 인공지능 프로젝트를 한건가?라는 의문이 가끔 든다. 그래서 개인적으로 프로토타입 제작 역할은 별로 선호하지 않는데 마침 부스트캠프 교육 과정에서 손쉽게 프로토타입을 만들어주는..

[티스토리] LaTex 설정해서 수식 표현하기 데이터와 인공지능을 주제로 다루는 티스토리 블로그라면 수식은 단연코 있어야 할텐데 아무 설정을 하지 않으면 티스토리에서 수식을 표현할 수 없다. 그래서 수식 표현을 위해 가장 많이 사용되는 LaTex를 설정하는 방법을 공유하려고 한다. 1. 스킨 편집으로 이동 [블로그 설정] -> 왼쪽 사이드 [꾸미기] -> [스킨 편집] 2. html 편집으로 이동 3. 사이의 아래 코드 입력 4. 테스트 $y = x + b$ $y = x + b$

[논문 리뷰] Efficient Estimation of Word Representations in Vector Space 문제점 및 기여 부분 텍스트 데이터를 벡터화 하기 위해 가장 많이 사용된 One-Hot Encoding 방식 대신 새로운 방법론인 CBOW와 Skip-gram을 제시하며 Word2Vec의 대표적인 알고리즘으로 자리잡았다. 목차 Introduction Models Results 1. Introduction 텍스트 데이터는 단어 혹은 문장이기 때문에 바로 학습할 수 없다. 그래서 학습을 위해 범주형 데이터를 수치형 데이터로 변환해줘야 하는데 기존에는 One-Hot Encoding 방식이 가장 많이 사용됐다. One-Hot Encoding이란, 표현하고자 하는 단어를 1, 나머지 단어를 0으로 채운 (1, 단어 개수) 크기의 벡터이다. 위에 그림처럼 사과~참외까지의 거리가 100이라면 단어 개수는 100개이다..

이전 1 2 3 4 5 6 ··· 21 다음

728x90

티스토리툴바