일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- gcp
- Python3
- 생성형AI
- 머신러닝
- Python
- nlp
- 파이썬기초100제
- 코드업파이썬
- Microsoft
- 빅데이터
- 코드업
- C#
- 구글퀵랩
- 파이썬
- 릿코드
- Blazor
- 투포인터
- 파이썬알고리즘
- GenAI
- 데이터사이언스
- Azure
- GenerativeAI
- 자연어처리
- 리트코드
- 알고리즘
- LeetCode
- 클라우드
- 파이썬기초
- two-pointer
- codeup
Archives
- Today
- Total
목록TF-IDF행렬만들기 (1)
Tech for good
[딥러닝을 이용한 자연어 처리 입문] 6. 토픽 모델링(Topic Modeling)- 3) 잠재 디리클레 할당(LDA) 실습2
목차 6. 토픽 모델링(Topic Modeling) 6.3. 잠재 디리클레 할당(LDA) 실습2 6.3.1. 실습을 통한 이해 1) 뉴스 기사 제목 데이터에 대한 이해 2) 텍스트 전처리 3) TF-IDF 행렬 만들기 4) 토픽 모델링 6. 토픽 모델링(Topic Modeling) 6.3. 잠재 디리클레 할당(LDA) 실습2 앞서 gensim을 통해서 LDA를 수행하고, 시각화를 진행해보았다. 이번에는 LSA 챕터에서처럼 사이킷런을 사용하여 LDA를 수행하여 보겠다. 사이킷런을 사용하므로 전반적인 과정은 LSA 챕터와 유사하다. 6.3.1. 실습을 통한 이해 1) 뉴스 기사 제목 데이터에 대한 이해 약 15년 동안 발행되었던 뉴스 기사 제목을 모아놓은 영어 데이터를 아래 링크에서 다운받을 수 있다. 링크..
IT/Data Science
2021. 10. 14. 12:08