Mounir RAJI

Cloud architect & AI builder

Freelance · Paris

Je construis des agents IA qui tournent sur ma propre machine — sans abonnement, sans données dans le cloud, sans dépendre d'une API qui peut changer ses tarifs demain matin.

Développeur freelance et architecte cloud, je travaille depuis des années sur des projets d'infrastructure et d'automatisation. Le pivot vers l'IA locale n'est pas venu d'un engouement pour la tendance — il est venu de la frustration de payer des tokens pour faire des choses simples, et de l'inconfort de confier mes données de travail à des serveurs que je ne contrôle pas.

Mon approche est celle d'un praticien qui documente : je construis quelque chose, ça casse, je comprends pourquoi, et j'écris ce que j'aurais voulu lire avant de commencer. Pas de tutoriels copiés de la doc officielle. Pas de "voici comment ça devrait marcher en théorie". Ce que tu trouveras ici, c'est ce qui s'est passé réellement.

Ce que je construis

Mon projet principal s'appelle Neog — un agent IA personnel self-hosted qui tourne en continu sur une VM Ubuntu. Il gère ma veille, génère mes briefs du matin, prend des notes dans Obsidian depuis Telegram, et répond vocalement sans toucher à une API externe.

Stack technique de Neog :

OpenClaw

Agent framework self-hosted

LM Studio

Runtime LLM local (GGUF)

Docker

Conteneurisation sur Ubuntu VM

Tailscale

Réseau privé entre machines

Obsidian

Mémoire persistante (vault Markdown)

Interface principale avec l'agent

Tout tourne sur une VM Ubuntu hébergée localement, accessible depuis n'importe où via Tailscale. Aucun port ouvert sur internet. Aucune donnée qui sort du réseau privé.

La série Neog

Je documente la construction de Neog article par article sur Medium, sous la publication Towards Artificial Intelligence. Chaque épisode couvre un problème réel rencontré en construisant — pas une feature imaginaire.

Pourquoi écrire tout ça

La documentation officielle des outils self-hosted IA explique comment les choses sont censées marcher. Elle n'explique pas pourquoi le gateway crash en boucle quand tu le bindes sur loopback dans Docker, ni pourquoi ton modèle 14B ne peut pas être un agent primaire avec 8k de contexte.

Ces articles existent parce que j'aurais voulu les trouver avant de passer deux heures sur un problème trivial. Si un seul lecteur gagne du temps grâce à ce que j'ai documenté, l'article a rempli son rôle.

Recevoir les prochains épisodes

La suite de la série Neog arrive — nouvelles intégrations, expériences sur le multi-agent, retours sur ce qui tient dans le temps et ce qui ne tient pas. Si tu veux être prévenu sans avoir à checker le site :

La newsletter

Un email par semaine quand il y a quelque chose à dire. Pas de contenu de remplissage.

S'abonner →

Contact

Pour une mission freelance, une collaboration, ou juste pour dire que tu as le même problème de contexte window avec un 14B : LinkedIn ou Medium.