NLP BERTAug 18, 2020 (Updated: Aug 20, 2020)·#NLP#BERTNLP Bidirectional Encoder Representations Form Transformer transformer의 encoder만 사용한다. Pre-traning과 fine-tuning으로 활용한다. 즉, transformer…
NLP Transformer & SentecePieceAug 15, 2020 (Updated: Aug 20, 2020)·#NLP#transformer#SentencePieceNLP CNN, RNN 대신 Self-Attention을 사용하는 모델 Transformer는 RNN, LSTM없이 time 시퀀스 역할을 하는 모델입니다. RNN, LSTM 셀을 일체 사용하지 않았으나, 자체만으로 time…
NLP maLSTMAug 07, 2020 (Updated: Aug 19, 2020)·#NLP#maLSTM#QuoraNLP Quora : 질문 간 텍스트 유사도 분석 maLSTM : 맨하탄 거리 사용한 LSTM GloVe : 빈도 + 맥락(Embedding) 고려한 워드 패키지 FastText : hash…
NLP Kaggle competition 우승자가 제안한 새로운 접근방법을 배워보자Aug 06, 2020 (Updated: Aug 19, 2020)·#NLP#논문 분석AUC Area under the roc curve (AUC) Confusion matix(Binaray classification) predictionP N actual P TP FP N FN TN TPR FPR Thes…
NLP Sequence to SequenceAug 15, 2020 (Updated: Aug 18, 2020)·#NLP#seq2seqNLP NLP, Time Serise/Sin data 예측에 사용한다. 기법 종류: seq2seq (RNN) > SL(fine Tuning) → USL Attention: RNN 기반 > SL(fine Tuning) → USL Self…
NLP 카운트 기반 방법의 텍스트 유사도 측정Aug 05, 2020 (Updated: Aug 18, 2020)·#NLP#SVD#거리 측정one-hot 인코딩 categorical 변환 방법 Keras를 이용한 one-hot encoding '남자' '여자' '아빠' '엄마' '삼촌' '이모' '남자', '삼촌', '아빠', '엄마', '여자', '이모' [1. 0. 0. 0.…
NLP Doc2VecAug 05, 2020 (Updated: Aug 18, 2020)·#NLP#Doc2Vec텍스트 분류 Skip-Gram SGNS Hirarchical softmax 연산이 많아진단 단점의 softmax를 개선하여 Binary Tree 사용 Binary Tree iForest 알고리즘, DB indexing…
NLP Ask Me AnythingAug 05, 2020 (Updated: Aug 18, 2020)·#NLP#attention#ask_me_anythingNLP 분야에서 딥러닝의 고급 응용 DMN Ask Me Anything attention score layer story layer episodic memory layer answer layer 텍스트 자동 생성 예제 문장: I love you…
NLP Word2Vec/SGNSJul 29, 2020 (Updated: Aug 16, 2020)·#NLP#Word2Vec#SGNSNLP & DL 특수 목적이 아닌, 범용적(일반적)으로 쓰일 Word Embedding을 만든다. embedding의 방법 따라서 문장 속 단어의 맥락(의미)를 파악할 줄 안다. 즉, semantic…
NLP EmbeddingJul 22, 2020 (Updated: Aug 16, 2020)·#NLP#EmbeddingNLP & 딥러닝 핵심 문제: "단어를 어떻게 수치화할 것인가?" Email - Classification 딥러닝을 이용하여 20개의 카테고리로 분류된 이메일 데이터를 학습하고, 시험 이메일을 20개 카테고리 중 하나로 분류한다. Email…
NLP 편집거리/주제식별/자연어분석Jul 20, 2020 (Updated: Aug 16, 2020)·#NLP#LDA#PageRank고급 NLP 레시피 자연어 기초 용어 편집거리 주제식별 감성분석 자연어 관련 용어 (문서) (말뭉치): 텍스트(문서)의 집합 (토큰): 단어처럼 의미를 가지는 요소 (형태소): 의미를 가지는 언어에서 최소 단위 (품사): ex) Nouns…
(NLP 기초) 문장 구조 분석Jul 17, 2020 (Updated: Aug 16, 2020)·#NLP#기초NLP 형식언어 이론 Context-free Grammar Context-sensitive Grammar Natural Language 문장 구조 분석 Word-salad…
(NLP 기초) 문서 정보 추출Jul 17, 2020 (Updated: Aug 16, 2020)·#NLP#기초NLP 정규표현식 청킹 칭킹 문서 정보 추출 정해진 패턴을 사용해서 패턴에 일치하는 데이터 검색을 지원하는 표현식 정규표현식에 쓰이는 특수문자 : 아무 문자나 여러 개 : } { 안의 내용 제외 = 읽어보기 DEVHolic…
(NLP 기초) 품사 태깅Jul 16, 2020 (Updated: Aug 16, 2020)·#NLP#기초NLP 품사 태깅 원리 HMM 품사 태깅 : 문장의 N, V, ad, av 판별 문장만 보고 품사를 붙여주는 기계: 문맥 = '문장 내' 주변 단어 = 현재 NLP 상에선 문장 간, 절 간 Context는 불가 "NLP…
딥러닝 LSTM&CNNJul 14, 2020 (Updated: Aug 16, 2020)·#DL#LSTM#CNN딥러닝 DL RNN CNN 순환 신경망(RNN) hidden 층에서 서로 값을 기억해 순환한다. 지금까진 FNN(feed forward neword) + 순서가 필요 없는 data를 써서 모델이 기억할 필요가 없었지만, 문장 같은 data…
딥러닝 기초Jul 03, 2020 (Updated: Aug 16, 2020)·#DL딥러닝 DL optimaizer kerass optimizers 이차방정식 계수 추정 방법들: : 움직임 : 미분해서 움직임 : 지수이동평균법으로 움직임 : 관성 방향으로 이동 후 그 지점에서 GD 방향으로 움직임 가중치(알파 or lr…
머신러닝 분석 방법들, 두 번째Jun 30, 2020 (Updated: Aug 16, 2020)·#ML#XGBoost머신러닝(ML) K-Means 클러스터링 H-clustering DBSAN 앙상블 연관규칙 분석 k-means 클러스터링 비지도학습 비계층적 군집분석 k-means 클러스터링은 데이터를 k개의 클러스터(cluster…
머신러닝 분석 방법들, 첫 번째Jun 23, 2020 (Updated: Aug 16, 2020)·#ML머신러닝(ML) KNN Decision Tree SVM 선형회귀분석 로지스틱회귀분석 나이브베이지안 차원(feature…
GAN 이론Aug 08, 2020 (Updated: Aug 08, 2020)·#DL#GANGAN 비지도학습(UL) 방식의 이미지, 문서, 음성 등의 데이터를 생성(모방)하는 알고리즘 비모수적방법으로도 비교적 정확한 sampling이 가능함 위조 데이터 생성 및 판별에 사용 EX…
GAN 실전 응용Aug 08, 2020 (Updated: Aug 08, 2020)·#DL#GANGAN 1D 정규분포에서 샘플링한 데이터를 모방하여, fake data를 생성한다. fake data는 정규분포의 특성을 갖는다. (KL divergence, 평균, 분산, 왜도, 첨도 등) Discrimi의 loss는 maxlog(Dx) + log…
TQT(The question I asked the teacher today)Aug 01, 2020 (Updated: Aug 06, 2020)·#TQTW(weights) 네트워크 및 model build까지 완성해서 실행되어 역전파 되었을 때 형성된다. : 네트워크 만들고 난 후 model build하는 과정. optimizer & loss 값을 정의해주는 부분임. w…