TF_IDF
(TF * IDF)
A : " a new car, used car, car review"
B : "A friend in need is a friend indeed."
Term Frequency Score
어떤단어가 많이 출현할 수록 그 문서와의 관계가 높을 것이다. = 가장 중요한 단어다.
단점 : A friend in need is a friend indeed. 경우, a 와 friend의 tf score가 같아 연관성을 나타내기 부족했음
IDF
log (총문장의 갯수 / 이 단어가 출현한 문장의 갯수)
728x90
'Study (Data Science) > DL' 카테고리의 다른 글
model.summary 에서의 param# 구하기 (0) | 2023.01.06 |
---|---|
활성화함수 종류 (0) | 2022.12.29 |
인공지능, 머신러닝 그리고 딥러닝 (4) | 2022.12.27 |
시계열 개념 / ADF Test / 시계열 분해 /ARIMA (0) | 2022.12.18 |
Loss / Metric (0) | 2022.12.15 |
댓글