AI·ML

AI·ML

AI·ML

Vector DB 입문 — pgvector vs Pinecone

의료 AI 시스템에서 임베딩 데이터 관리에 필수인 벡터 데이터베이스. pgvector와 Pinecone의 작동 원리, 성능 스펙, 임상 적용 사례를 정량 비교.

정서연
AI·ML

LLM 추론 비용 줄이기 — 양자화와 캐싱

대규모 언어모델의 추론 비용을 감소시키는 핵심 기술인 양자화(quantization)와 KV 캐싱의 작동 메커니즘, 성능 지표, 임상 적용 사례를 기술 문서 형식으로 정리합니다.

정재현
AI·ML

RAG 패턴으로 LLM에 외부 지식 주입하기

RAG(Retrieval-Augmented Generation) 패턴은 대규모언어모델에 실시간 외부 데이터를 연동하는 아키텍처입니다. 의료 데이터 통합, 할루시네이션 감소, 최신 정보 제공 등 3가지 핵심 기능을 제공합니다.

정민우
AI·ML

Vector DB 입문 — pgvector vs Pinecone

의료 AI 시스템에서 사용되는 벡터 데이터베이스 두 가지를 기술 스펙과 임상 검증 데이터로 비교합니다. pgvector와 Pinecone의 작동 원리, 성능 지표, 도입 사례를 정리했습니다.

김지훈