[필수 과제] Data Preprocessing
210906
1. Spacy를 이용한 영어 전처리
import spacy
spacy_en = spacy.load('en')nlp = spacy.load('en_core_web_sm')1.1 Tokenization
1.2 불용어 (Stopword)
1.3 Lemmatization
1.4 그외 token class의 attributes

빈칸완성 과제 1
2. 한국어 전처리
2.1 Mecab을 이용한 형태소 분석 기반 토크나이징
2.2 음절 단위 토크나이징 실습
빈칸완성 과제 2
Last updated