일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- ListAdapter DiffUtil
- android ktor
- kotlin collection
- Python
- 유튜브
- ExoPlayer
- Zsh
- android custom view
- exoplayer cache
- kotlin list
- AWS EC2
- ktor client
- video caching
- 안드로이드
- DiffUtil.ItemCallback
- 시행착오
- android exoplayer
- 스피너
- android
- ListAdapter
- ChatGPT
- 유튜브 요약
- map
- list map
- getChangePayload
- FastAPI
- llm
- build with ai
- ktor api call
- doc2vec
- Today
- Total
목록doc2vec (2)
버튼 수집상
Elastic Search Search API 결과 { 'took': 5, 'timed_out': False, '_shards': { 'total': 1, 'successful': 1, 'skipped': 0, 'failed': 0 }, 'hits': { 'total': { 'value': 1, 'relation': 'eq' }, 'max_score': 1.0, 'hits': [ { '_index': 'INDEX_NAME', '_id': 'ID', '_score': 1.0, '_source': { 'item_idx': 4561, 'subject': '글 제목 예시', 'contents': "글 내용 예시입니다. 보통 이것보다도 줄줄이 길게 들어갑니다.", 'author_nick': '작성자명', 'cre..

순서 1. 데이터셋 준비 2. 형태소 분석 (Tokenization) - 한글 형태소 분석기 nori, konlpy - Elasticsearch 의 REST api 사용하거나 파이썬 모듈 사용 - Elasticsearch 콘솔 홈 > Dev Tools 에서 REST api 테스트 가능 3. 단어장 (Vocabulary) - 빈 단어장 생성 - 형태소 분석이 완료된 텍스트 데이터를 단어장에 업데이트 - 중복 제거하고 각 토큰마다 식별ID 부여 4. 단어 임베딩 (Embedding) - 모델: Word2Vec, FastText, gensim 등 - 토큰화된 텍스트를 위 모델들에게 학습시켜서 벡터 얻기 Elasticsearch 용어집 SQL Elasticsearch Database Index Table x R..