À propos & méthodo.
Lantern trie la veille conversion pour toi : il lit les meilleures sources CRO, score chaque article sur la pertinence, la rigueur et l'actionnabilité, et te livre une sélection courte. Pas de pubs, pas de tracker, pas d'algorithme opaque. Cette page documente exactement ce qui se passe entre une URL source et l'article qui apparaît dans ton feed.
l'origine
La veille conversion est éparpillée. Nielsen Norman, Baymard, les blogs CRO, des études derrière un paywall, des threads qui défilent. Je voulais suivre ce qui marche vraiment sur une page ou un funnel — pas les « 10 growth hacks » recyclés — et je passais plus de temps à chercher le signal qu'à l'appliquer.
Lantern est ce que j'aurais voulu lire à la place. Une seule page, déjà filtrée. Un agent qui a lu la semaine de veille pour moi, viré les redites et les pitchs déguisés, scoré le reste sur ce qui compte — pertinence conversion, rigueur de la preuve, actionnabilité — et m'en sort une sélection courte avec des résumés honnêtes. Pas de marketing, pas de teaser reformaté.
Je le construis seul, le soir et les weekends. C'est un projet d'auteur, pas une startup. Ça veut dire trois choses :
- Pas de pubs, pas de tracker. Lantern ne te suit pas, ne vend pas tes données, et n'a aucun script tiers chargé.
- Pas de growth hacking. Ironique pour un site CRO, mais : pas de notif push, pas de gamification, pas de « streak ». Tu lis quand tu veux.
- Curation explicite. Les sources sont publiques, le scoring est documenté ci-dessous, et l'IA ne réordonne jamais ta lecture : le feed est chronologique par défaut, le tri par score est opt-in.
d'une URL au feed
Chaque article qui apparaît dans ton feed a traversé cinq étapes. La plupart prennent quelques secondes ; le scoring LLM est le goulot d'étranglement. Le pipeline tourne une fois par jour — un rythme choisi, pas une limite technique : la dizaine de sources actives ne publie pas en continu, un passage quotidien suffit largement.
+-- 01 -----+ +-- 02 ------+ +-- 03 ------+ +-- 04 -----+ +-- 05 -----+ | FETCH | -> | EXTRACT | -> | DEDUPE | -> | SCORE | -> | PUBLISH | +-----------+ +------------+ +------------+ +-----------+ +-----------+ rss-parser readability simhash 64b gpt-5-nano ranking + feed
Ce qui suit détaille chaque étape — ce qu'elle reçoit, ce qu'elle produit, et ce qu'elle peut rater.
Récupération brute du contenu
Un cron quotidien visite chaque source active via son flux RSS/Atom. Pas de scraper maison : toutes les sources suivies (Nielsen Norman, Baymard, Speero, Oddit, …) publient un flux propre, donc l'étape est simple et robuste. La liste complète vit sur la page Sources.
Extraction du contenu propre
Quand un flux ne livre qu'un résumé, on va chercher la page et l'algorithme readability (port de Mozilla) sépare le contenu de la chrome (header, sidebar, related). Pour les flux qui livrent déjà du markup propre, on saute cette étape.
Déduplication sémantique
Un hash simhash 64-bit est calculé sur le début de l'article. Si un article ingéré dans les 14 derniers jours a un hash à distance de Hamming < 8, on considère que c'est un cross-post (le même teardown repris d'une source à l'autre, par exemple) et on garde la source la plus tôt — les autres sont marquées « alias ».
Scoring LLM & tagging
GPT-5-nano reçoit le titre, le contenu et un prompt système court. Il retourne : un score
de 1 à 5 sur trois axes (pertinence, rigueur, actionnabilité), un type
(article / tool / study / case-study / framework), 2 à 5 tags, un résumé d'une ligne
et trois justifications. Voir §03 Comment je score pour le prompt complet.
Publication & ranking
L'article rejoint la base. Le feed est chronologique par défaut ; le tri par score est opt-in. Les articles à score < 3.5 sont gardés en base (audit, calibration du seuil) mais jamais publiés — le feed public ne montre que ≥ 3.5.
le prompt, la grille
Le scoring est le seul endroit où l'IA décide quelque chose à ta place. Pour que ce soit honnête, voici le prompt système exact, et la grille qu'il applique. Et tu peux toujours ignorer le score : le feed est chronologique par défaut — le tri par score et le filtre de score minimum sont opt-in.
La grille
- 5 ★ — Cœur conversion. Preuve chiffrée, directement transférable à une vraie page ou un funnel. Étude, expé avant/après, teardown reproductible.
- 4 ★ — Très bon. Preuve réelle (cas chiffré, méthodo explicite) et applicable.
- 3 ★ — Solide mais adjacent ou déjà vu. Argumenté, un bon exemple.
- 2 ★ — Marginal ou promotionnel. Teaser sans substance, pitch d'outil sans données.
- 1 ★ — Bruit. Hors-sujet, claim sans preuve, prose AI-generated.
Seuil de publication : le score final est le composé pondéré des trois axes (0.4·pertinence + 0.3·rigueur + 0.3·actionnabilité, échelle 1.0–5.0). Un article passe la barre quand ce composé est ≥ 3.5 / 5. En dessous, il reste en base (audit, calibration) mais n'apparaît pas dans le feed public.
Le prompt système (extrait)
# rôle : évaluateur de veille CRO / growth
Tu es un évaluateur de veille pour un praticien CRO / growth qui
build et fait grandir un produit (conversion, pricing, expérimentation,
UX, outillage). Tu produis un score structuré, pas un résumé marketing.
# 3 axes, entiers 1-5
- PERTINENCE Utile à un builder qui fait grandir un produit ?
1 = hors-sujet · 5 = cœur conversion/pricing,
directement transférable à une page/funnel.
GATE IA : un contenu IA n'est pertinent QUE s'il
relie l'IA à un levier conversion/growth mesuré
(test, funnel, pricing, uplift chiffré). Sinon
(review de modèle, tuto "how I AI", annonce d'une
feature agent vendor) → 1-2.
- RIGUEUR Thèse étayée (données, méthodo, test) ou promo ?
Un teaser purement promo OU un billet où un vendor
promeut son propre produit avec des chiffres
internes invérifiables plafonne à 2, même d'une
source réputée.
- ACTIONNABILITE Applicable sur une vraie page / un test cette
semaine ? 1 = théorique · 5 = méthode clé en main.
# ajustements (le LLM les applique lui-même)
- anti-patterns (-1) : listicle creux, vendor content déguisé,
uplift annoncé sans chiffres, prose AI boilerplate.
- bonus (+1) : avant->après chiffré, recherche quanti avec méthodo,
retour d'XP réel sur un test.
Sortie JSON stricte : { depth, novelty, applicability, type,
tags, summary, reasons }Les trois axes sont pondérés côté code (0.4 pertinence · 0.3 rigueur · 0.3 actionnabilité) pour
donner le score final — ils sont stockés sous leurs clés JSON historiques depth /
novelty / applicability, d'où les noms dans la sortie du prompt ci-dessus. Le prompt est
versionné et figé pour rester comparable d'une semaine à
l'autre ; quand on bump (rare), c'est noté dans le changelog.
Ce que je ne fais pas
- Pas de personnalisation par utilisateur. Tout le monde voit le même score édito. Lantern n'apprend pas de tes clics.
- Pas d'A/B test sur les titres. Le titre affiché est celui de la source, point.
- Pas de boost commercial. Aucune source ne paie pour apparaître. Aucune source n'est exclue parce qu'elle nous critique.
les questions habituelles
Q.01Lantern est gratuit. C'est quoi le piège ?
Pas de piège. C'est un projet perso, le coût d'infra reste gérable solo. Si l'audience grossit, j'ouvrirai sûrement un tier « supporter » optionnel pour aider à payer le compute LLM, mais le cœur restera gratuit. Pas de freemium déguisé, pas de paywall qui apparaît un jour.
Q.02Pourquoi pas une appli mobile ?
Le site est responsive et lit correctement sur mobile. Une appli native demanderait un store, des reviews, un cycle de release — pour un projet solo, c'est trop. Si tu veux un truc à toi sur l'écran d'accueil, ajoute le site comme PWA depuis Safari/Chrome.
Q.03Comment proposer une source ?
Depuis la page Sources, en bas, « Ajouter une source ». Tu colles l'URL, je vérifie manuellement (qualité, fréquence, pertinence conversion) et j'ajoute si ça colle au feed. Tu peux aussi me ping sur X ou par mail.
Q.04Mes données sont-elles partagées ?
Non. Aucun tracker tiers, aucun pixel, aucun script third-party. Les détails complets — ce qui est collecté, sous-traitants (Vercel, Neon UE, Resend, OpenAI, GitHub, Google), rétention et tes droits RGPD — sont sur la page Politique de confidentialité.
Q.05Pourquoi un seul modèle au lieu de switcher ?
Parce que le score doit rester comparable d'une semaine à l'autre. Switcher de modèle change subtilement la grille, et pollue les comparaisons historiques. Je benchmark le modèle contre les concurrents tous les 3 mois ; je ne migre que si l'écart de qualité est clair, et je note la migration dans le changelog.
Q.06Lantern peut-il rater un article important ?
Oui. Trois cas de figure : (1) la source n'est pas couverte — si l'auteur poste sur un blog perso pas indexé par Lantern, je ne le verrai pas (proposer une source via la page Sources reste le meilleur fix) ; (2) le LLM sous-évalue — une étude dense mais sèche, ou un post court, peut sortir à 3★ alors qu'il méritait 4 ; (3) un cross-post est rangé en alias — si Lantern voit le même teardown repris sur deux sources, il garde la première vue et marque l'autre comme alias. Pour ces trois cas, pas de filet de rattrapage aujourd'hui : ce que le pipeline écarte n'atteint pas le feed. Les fixes : suggérer la source manquante, ou me pinger quand un article a été sous-noté. Lantern n'est pas exhaustif — il est filtré. Si tu veux la totale, garde Feedly à côté.