RAG Framework From Scratch

Développement d'un framework RAG (Retrieval-Augmented Generation) complet à partir de zéro, permettant d'interroger des documents personnels avec une précision accrue grâce à l'intégration de bases de données vectorielles et de modèles de langage.

Contributeurs

Boris TAKOU KENNE

Compétences

LLM

Python

Vector DB

RAG

LangChain

Publié

Mars 2026

Liens importants

GitHub

Contexte du projet

Les LLMs sont entraînés sur de vastes volumes de données, mais ces données restent statiques.
Cela limite leur capacité à raisonner sur des informations récentes, spécifiques ou propriétaires.

Une solution consiste à faire du fine-tuning, mais cette approche est souvent coûteuse, longue à mettre en place et difficile à maintenir.

C’est ici qu’intervient le RAG (Retrieval-Augmented Generation).

Le RAG est un mécanisme qui permet d’étendre la base de connaissances d’un LLM en récupérant dynamiquement des informations depuis vos propres données (documents, bases internes, PDFs, etc.) pour enrichir la génération de réponse.

Dans ce projet, j’utilise LangChain, un framework open-source conçu pour construire des applications basées sur des LLMs et orchestrer des pipelines intelligents (chargement de documents, indexation, recherche sémantique, génération).

À travers ce projet, je compte approfondir trois axes principaux :

📚 Document Indexing – structurer et vectoriser les documents pour les rendre exploitables

🔎 Semantic Search – récupérer les informations les plus pertinentes via des embeddings

🧠 LLM Generation – générer des réponses contextualisées et fiables

RAG Framework From Scratch

Contexte du projet

📚 Document Indexing – structurer et vectoriser les documents pour les rendre exploitables

🔎 Semantic Search – récupérer les informations les plus pertinentes via des embeddings

🧠 LLM Generation – générer des réponses contextualisées et fiables

Étapes du projet

Charger les documents (Document Loading)

Découper les documents (Text Splitting)

Transformer en embeddings

Stocker dans une base vectorielle

Retrieval (Recherche sémantique)

Augmentation du prompt (Augmented Prompt)

Génération avec le LLM

RAG Framework From Scratch

Contexte du projet

📚 Document Indexing – structurer et vectoriser les documents pour les rendre exploitables

🔎 Semantic Search – récupérer les informations les plus pertinentes via des embeddings

🧠 LLM Generation – générer des réponses contextualisées et fiables

Étapes du projet

Charger les documents (Document Loading)

Découper les documents (Text Splitting)

Transformer en embeddings

Stocker dans une base vectorielle

Retrieval (Recherche sémantique)

Augmentation du prompt (Augmented Prompt)

Génération avec le LLM

Échangeons ensemble