Embedding
En embedding er en numerisk representasjon av tekst (eller bilde) som lar AI-systemer sammenligne semantisk likhet.
Også kjent som: vektor-embedding, tekst-embedding
En embedding er en numerisk representasjon — en vektor av flere hundre tall — som fanger den semantiske betydningen av en tekst eller et bilde. To tekster med lignende mening får lignende embedding-vektorer, selv om de bruker forskjellige ord. Embeddings er fundamentet i RAG-systemer: når du stiller et spørsmål, konverteres det til en embedding, som så brukes til å finne dokumenter med lignende embeddings i en vektor-database. Dette er hvorfor moderne AI-søk kan finne relevante dokumenter selv når ingen av søkeordene står i dokumentet.
Relaterte begreper
- RAG (Retrieval-Augmented Generation) — RAG er en teknikk der en språkmodell svarer ut fra bedriftens egne dokumenter — i stedet for kun den generelle treningen.
- Vektor-database — En vektor-database er en database optimalisert for å lagre og søke i embeddings — fundamentet i RAG-systemer og AI-søk.
- LLM (Large Language Model) — En LLM er en stor språkmodell trent på enorme tekstmengder, som kan generere, oppsummere og analysere tekst på menneskelignende måte.