Vol. I · À propos

Comment Lantern lit le web pour toi · doc v0.8 · mise à jour 11 juin

Édité par Q. Lecocq · Lille, FR

§ MéthodologiePourquoi · comment · pour qui

À propos & méthodo.

Lantern trie la veille conversion pour toi : il lit les meilleures sources CRO, score chaque article sur la pertinence, la rigueur et l'actionnabilité, et te livre une sélection courte. Pas de pubs, pas de tracker, pas d'algorithme opaque. Cette page documente exactement ce qui se passe entre une URL source et l'article qui apparaît dans ton feed.

§ 01POURQUOI LANTERN

l'origine

~2 min

La veille conversion est éparpillée. Nielsen Norman, Baymard, les blogs CRO, des études derrière un paywall, des threads qui défilent. Je voulais suivre ce qui marche vraiment sur une page ou un funnel — pas les « 10 growth hacks » recyclés — et je passais plus de temps à chercher le signal qu'à l'appliquer.

Lantern est ce que j'aurais voulu lire à la place. Une seule page, déjà filtrée. Un agent qui a lu la semaine de veille pour moi, viré les redites et les pitchs déguisés, scoré le reste sur ce qui compte — pertinence conversion, rigueur de la preuve, actionnabilité — et m'en sort une sélection courte avec des résumés honnêtes. Pas de marketing, pas de teaser reformaté.

Je le construis seul, le soir et les weekends. C'est un projet d'auteur, pas une startup. Ça veut dire trois choses :

Pas de pubs, pas de tracker. Lantern ne te suit pas, ne vend pas tes données, et n'a aucun script tiers chargé.
Pas de growth hacking. Ironique pour un site CRO, mais : pas de notif push, pas de gamification, pas de « streak ». Tu lis quand tu veux.
Curation explicite. Les sources sont publiques, le scoring est documenté ci-dessous, et l'IA ne réordonne jamais ta lecture : le feed est chronologique par défaut, le tri par score est opt-in.

§ 02LE PIPELINE

d'une URL au feed

5 étapes

Chaque article qui apparaît dans ton feed a traversé cinq étapes. La plupart prennent quelques secondes ; le scoring LLM est le goulot d'étranglement. Le pipeline tourne une fois par jour — un rythme choisi, pas une limite technique : la dizaine de sources actives ne publie pas en continu, un passage quotidien suffit largement.

+-- 01 -----+    +-- 02 ------+    +-- 03 ------+    +-- 04 -----+    +-- 05 -----+
|  FETCH    | -> |  EXTRACT   | -> |  DEDUPE    | -> |  SCORE    | -> |  PUBLISH  |
+-----------+    +------------+    +------------+    +-----------+    +-----------+
rss-parser       readability       simhash 64b       gpt-5-nano     ranking + feed

Ce qui suit détaille chaque étape — ce qu'elle reçoit, ce qu'elle produit, et ce qu'elle peut rater.

01FETCH

Récupération brute du contenu

Un cron quotidien visite chaque source active via son flux RSS/Atom. Pas de scraper maison : toutes les sources suivies (Nielsen Norman, Baymard, Speero, Oddit, …) publient un flux propre, donc l'étape est simple et robuste. La liste complète vit sur la page Sources.

Librss-parser

Cadence1×/jour

Sources~10

02EXTRACT

Extraction du contenu propre

Quand un flux ne livre qu'un résumé, on va chercher la page et l'algorithme readability (port de Mozilla) sépare le contenu de la chrome (header, sidebar, related). Pour les flux qui livrent déjà du markup propre, on saute cette étape.

Lib@mozilla/readability

Outputtitle, body, lang

03DEDUPE

Déduplication sémantique

Un hash simhash 64-bit est calculé sur le début de l'article. Si un article ingéré dans les 14 derniers jours a un hash à distance de Hamming < 8, on considère que c'est un cross-post (le même teardown repris d'une source à l'autre, par exemple) et on garde la source la plus tôt — les autres sont marquées « alias ».

Méthodesimhash 64-bit

Fenêtre14 j

SeuilHamming < 8

04SCORE

Scoring LLM & tagging

GPT-5-nano reçoit le titre, le contenu et un prompt système court. Il retourne : un score de 1 à 5 sur trois axes (pertinence, rigueur, actionnabilité), un type (article / tool / study / case-study / framework), 2 à 5 tags, un résumé d'une ligne et trois justifications. Voir §03 Comment je score pour le prompt complet.

Modèlegpt-5-nano

FormatJSON schema

Promptv1.2-cro

05PUBLISH

Publication & ranking

L'article rejoint la base. Le feed est chronologique par défaut ; le tri par score est opt-in. Les articles à score < 3.5 sont gardés en base (audit, calibration du seuil) mais jamais publiés — le feed public ne montre que ≥ 3.5.

DBNeon · pg

Seuilscore ≥ 3.5

§ 03COMMENT JE SCORE

le prompt, la grille

prompt v1.2-cro

Le scoring est le seul endroit où l'IA décide quelque chose à ta place. Pour que ce soit honnête, voici le prompt système exact, et la grille qu'il applique. Et tu peux toujours ignorer le score : le feed est chronologique par défaut — le tri par score et le filtre de score minimum sont opt-in.

La grille

5 ★ — Cœur conversion. Preuve chiffrée, directement transférable à une vraie page ou un funnel. Étude, expé avant/après, teardown reproductible.
4 ★ — Très bon. Preuve réelle (cas chiffré, méthodo explicite) et applicable.
3 ★ — Solide mais adjacent ou déjà vu. Argumenté, un bon exemple.
2 ★ — Marginal ou promotionnel. Teaser sans substance, pitch d'outil sans données.
1 ★ — Bruit. Hors-sujet, claim sans preuve, prose AI-generated.

Seuil de publication : le score final est le composé pondéré des trois axes (0.4·pertinence + 0.3·rigueur + 0.3·actionnabilité, échelle 1.0–5.0). Un article passe la barre quand ce composé est ≥ 3.5 / 5. En dessous, il reste en base (audit, calibration) mais n'apparaît pas dans le feed public.

Le prompt système (extrait)

# rôle : évaluateur de veille CRO / growth
Tu es un évaluateur de veille pour un praticien CRO / growth qui
build et fait grandir un produit (conversion, pricing, expérimentation,
UX, outillage). Tu produis un score structuré, pas un résumé marketing.

# 3 axes, entiers 1-5
- PERTINENCE      Utile à un builder qui fait grandir un produit ?
                1 = hors-sujet · 5 = cœur conversion/pricing,
                directement transférable à une page/funnel.
                GATE IA : un contenu IA n'est pertinent QUE s'il
                relie l'IA à un levier conversion/growth mesuré
                (test, funnel, pricing, uplift chiffré). Sinon
                (review de modèle, tuto "how I AI", annonce d'une
                feature agent vendor) → 1-2.
- RIGUEUR         Thèse étayée (données, méthodo, test) ou promo ?
                Un teaser purement promo OU un billet où un vendor
                promeut son propre produit avec des chiffres
                internes invérifiables plafonne à 2, même d'une
                source réputée.
- ACTIONNABILITE  Applicable sur une vraie page / un test cette
                semaine ? 1 = théorique · 5 = méthode clé en main.

# ajustements (le LLM les applique lui-même)
- anti-patterns (-1) : listicle creux, vendor content déguisé,
uplift annoncé sans chiffres, prose AI boilerplate.
- bonus (+1) : avant->après chiffré, recherche quanti avec méthodo,
retour d'XP réel sur un test.

Sortie JSON stricte : { depth, novelty, applicability, type,
tags, summary, reasons }

Les trois axes sont pondérés côté code (0.4 pertinence · 0.3 rigueur · 0.3 actionnabilité) pour donner le score final — ils sont stockés sous leurs clés JSON historiques depth / novelty / applicability, d'où les noms dans la sortie du prompt ci-dessus. Le prompt est versionné et figé pour rester comparable d'une semaine à l'autre ; quand on bump (rare), c'est noté dans le changelog.

Ce que je ne fais pas

Pas de personnalisation par utilisateur. Tout le monde voit le même score édito. Lantern n'apprend pas de tes clics.
Pas d'A/B test sur les titres. Le titre affiché est celui de la source, point.
Pas de boost commercial. Aucune source ne paie pour apparaître. Aucune source n'est exclue parce qu'elle nous critique.

§ 04FAQ

les questions habituelles

6 entrées

Q.01Lantern est gratuit. C'est quoi le piège ?

Pas de piège. C'est un projet perso, le coût d'infra reste gérable solo. Si l'audience grossit, j'ouvrirai sûrement un tier « supporter » optionnel pour aider à payer le compute LLM, mais le cœur restera gratuit. Pas de freemium déguisé, pas de paywall qui apparaît un jour.

Q.02Pourquoi pas une appli mobile ?

Le site est responsive et lit correctement sur mobile. Une appli native demanderait un store, des reviews, un cycle de release — pour un projet solo, c'est trop. Si tu veux un truc à toi sur l'écran d'accueil, ajoute le site comme PWA depuis Safari/Chrome.

Q.03Comment proposer une source ?

Depuis la page Sources, en bas, « Ajouter une source ». Tu colles l'URL, je vérifie manuellement (qualité, fréquence, pertinence conversion) et j'ajoute si ça colle au feed. Tu peux aussi me ping sur X ou par mail.

Q.04Mes données sont-elles partagées ?

Non. Aucun tracker tiers, aucun pixel, aucun script third-party. Les détails complets — ce qui est collecté, sous-traitants (Vercel, Neon UE, Resend, OpenAI, GitHub, Google), rétention et tes droits RGPD — sont sur la page Politique de confidentialité.

Q.05Pourquoi un seul modèle au lieu de switcher ?

Parce que le score doit rester comparable d'une semaine à l'autre. Switcher de modèle change subtilement la grille, et pollue les comparaisons historiques. Je benchmark le modèle contre les concurrents tous les 3 mois ; je ne migre que si l'écart de qualité est clair, et je note la migration dans le changelog.

Q.06Lantern peut-il rater un article important ?

Oui. Trois cas de figure : (1) la source n'est pas couverte — si l'auteur poste sur un blog perso pas indexé par Lantern, je ne le verrai pas (proposer une source via la page Sources reste le meilleur fix) ; (2) le LLM sous-évalue — une étude dense mais sèche, ou un post court, peut sortir à 3★ alors qu'il méritait 4 ; (3) un cross-post est rangé en alias — si Lantern voit le même teardown repris sur deux sources, il garde la première vue et marque l'autre comme alias. Pour ces trois cas, pas de filet de rattrapage aujourd'hui : ce que le pipeline écarte n'atteint pas le feed. Les fixes : suggérer la source manquante, ou me pinger quand un article a été sous-noté. Lantern n'est pas exhaustif — il est filtré. Si tu veux la totale, garde Feedly à côté.

§ 05JOURNAL

ce qui a bougé

10 entrées récentes

v0.811 juinTUNINGAnti-bruit IA — prompt v1.2-cro avec gate IA explicite (review de modèle, tuto "how I AI", annonce d'agent vendor → 1-2), cap rigueur=2 étendu au vendor self-promo. Seuil de publication bumpé 3 → 3.5.

v0.711 juinFOCUSSpécialisation CRO / growth — ~10 sources expertes (Baymard, Speero, Oddit, …), prompt de scoring v1.1-cro, refonte de la copy.

v0.602 maiFEATUREPage About + sign-in 2-col éditorial — refonte UI, design tokens partagés.

v0.501 maiREFACTORPipeline modulaire — séparation extract/dedupe/score/publish, schémas split (articles/scores/sources).

v0.430 avr.SOURCEÉlargissement sources dev front+back.

v0.3.129 avr.FEATUREDigest hebdo lancé via gpt-5 + admin dashboard /admin (7 sections).

v0.329 avr.MIGRATIONSwitch ingestion : opencode zen → OpenAI gpt-5-nano (qualité + coût).

v0.227 avr.FEATUREWeb content fetcher (Readability) + sources GitHub Trending RSS.

v0.126 avr.RELEASEBootstrap Lantern — Next.js 16, Drizzle/Neon, Auth.js magic link, scoring LLM, cron Vercel.

v0.026 avr.INITInitial commit — scaffold Next.js + structure feature-based.

— L'auteur

Fait solo par Quentin Lecocq.

Dev fullstack par formation, designer par accident, basé à Lille. Lantern est mon side-project en cours depuis avril 2026. Si tu veux discuter d'une source à ajouter, pointer un bug, ou juste papoter conversion & growth — je suis joignable partout.

Tout retour est lu. Promis.

[X][GitHub][LinkedIn][Audit CRO][Mail]

+- colophon --------------+
| stack    : Next 16      |
| db       : Neon · pg    |
| host     : Vercel       |
| llm      : gpt-5-nano   |
| font     : Geist Mono   |
| since    : 26 avr 2026  |
+-------------------------+