임베딩 벡터 - 10. 정리 및 참고자료
2025. 3. 26. 20:21ㆍAI/AI
📘 10. 정리 및 참고자료
🔹 10.1 핵심 개념 요약
핵심 개념 | 요약 설명 |
임베딩 벡터 | 텍스트, 이미지, 사용자 데이터 등을 의미 기반 수치 벡터로 변환한 표현 |
임베딩의 목적 | 의미 보존, 유사성 계산, 기계 학습 입력으로 활용 |
임베딩 방식 | 수작업 기반, 통계 기반(TF-IDF), 신경망 기반 (Word2Vec, BERT 등) |
임베딩 활용 | 검색, 추천, 문장 분류, 질의응답, 시각화 등 |
임베딩 품질 평가 | 유사도 기반, 다운스트림 태스크, 다국어/멀티모달 테스트 |
주의사항 | 차원 수, 편향 문제, 과적합, 전처리 일관성, 리소스 최적화 필요 |
🔹 10.2 참고 논문 및 공식 링크
📄 주요 논문
- Word2Vec – Mikolov et al., 2013
Efficient Estimation of Word Representations in Vector Space - GloVe – Pennington et al., 2014
GloVe: Global Vectors for Word Representation - FastText – Bojanowski et al., 2017
Enriching Word Vectors with Subword Information - BERT – Devlin et al., 2018
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding - SimCSE – Gao et al., 2021
SimCSE: Simple Contrastive Learning of Sentence Embeddings
🔗 공식 도구/API 링크
- Hugging Face Transformers
https://huggingface.co/transformers/ - Sentence-Transformers
https://www.sbert.net/ - OpenAI Embedding API
https://platform.openai.com/docs/guides/embeddings - FAISS (Facebook AI)
https://github.com/facebookresearch/faiss - Pinecone (벡터 DB)
https://www.pinecone.io/
'AI > AI' 카테고리의 다른 글
임베딩 벡터 - 9. 실습 예제 및 코드 (0) | 2025.03.26 |
---|---|
임베딩 벡터 - 8. 임베딩 벡터 활용 시 주의사항 (0) | 2025.03.26 |
임베딩 벡터 - 7. 최신 동향과 기술 (0) | 2025.03.26 |
임베딩 벡터 - 6. 임베딩 품질 평가 (0) | 2025.03.26 |
임베딩 벡터 - 5. 임베딩 벡터의 활용 (0) | 2025.03.26 |