Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- android
- AWS EC2
- ExoPlayer
- kotlin collection
- kotlin list
- android custom view
- FastAPI
- 유튜브 요약
- Python
- 안드로이드
- DiffUtil.ItemCallback
- llm
- ktor client
- android exoplayer
- build with ai
- 스피너
- 시행착오
- ListAdapter DiffUtil
- map
- 유튜브
- doc2vec
- Zsh
- ListAdapter
- android ktor
- exoplayer cache
- ktor api call
- list map
- getChangePayload
- ChatGPT
- video caching
Archives
- Today
- Total
목록Elastic Search (1)
버튼 수집상

순서 1. 데이터셋 준비 2. 형태소 분석 (Tokenization) - 한글 형태소 분석기 nori, konlpy - Elasticsearch 의 REST api 사용하거나 파이썬 모듈 사용 - Elasticsearch 콘솔 홈 > Dev Tools 에서 REST api 테스트 가능 3. 단어장 (Vocabulary) - 빈 단어장 생성 - 형태소 분석이 완료된 텍스트 데이터를 단어장에 업데이트 - 중복 제거하고 각 토큰마다 식별ID 부여 4. 단어 임베딩 (Embedding) - 모델: Word2Vec, FastText, gensim 등 - 토큰화된 텍스트를 위 모델들에게 학습시켜서 벡터 얻기 Elasticsearch 용어집 SQL Elasticsearch Database Index Table x R..
TIL - Elastic Search
2023. 10. 17. 20:35