App macOS · Apple Silicon · en préparation

Serveur LLM local
natif Apple Silicon.

MLX-Launcher transforme votre Mac Apple Silicon en serveur LLM local performant. API OpenAI-compatible, multi-modèles, zéro cloud, optimisé sur le framework MLX natif d'Apple.

Rejoindre l'accès anticipé Installation pro sur mesure

— MLX framework · API OpenAI · Menu bar macOS —

Capacités natives

Tout ce qu'il faut, rien de plus.

Un seul outil pour faire tourner vos modèles LLM préférés localement, exposer une API OpenAI-compatible, et monitorer la mémoire et les performances en temps réel — directement depuis la barre de menus macOS.

◆

Modèles MLX locaux

Lancez vos modèles MLX préférés sur votre Mac, sans terminal ni configuration. Bascule rapide entre Qwen, Llama, Mistral, DeepSeek selon votre besoin.

Modèles MLX (4-bit, 8-bit, BF16)
Téléchargement direct depuis Hugging Face
Bascule à chaud sans redémarrage
Monitoring RAM intégré

▣

API OpenAI-compatible

Endpoints HTTP standards (/v1/models, /v1/chat/completions). Plug-and-play avec vos clients préférés sans configuration particulière.

Continue.dev, Cursor, Aider, Cline
Open WebUI, LangChain, LlamaIndex
Curl, Python OpenAI SDK
URLs locale + LAN affichées

◐

Apple Silicon natif

Construit sur le framework MLX d'Apple. Pas de Python à gérer, pas de Docker, pas de bricolage. Performances optimisées sur M1, M2, M3, M4, M5.

Mémoire unifiée GPU/CPU exploitée
Lancement rapide
Réseau local par défaut — LAN optionnel, aucune exposition Internet dans la version grand public

État du projet — transparence

Où en est MLX-Launcher aujourd'hui.

On préfère annoncer l'état réel plutôt que promettre une disponibilité immédiate. Voici où en sont les deux canaux de distribution prévus.

En préparation

Mac App Store

Version sandboxée réseau local, en cours de finalisation technique avant soumission à l'App Review d'Apple. Pas encore de fiche publique — inscrivez-vous pour être averti dès l'ouverture des ventes.

En préparation

Téléchargement direct (DMG)

Version complète hors sandbox (accès réseau étendu), signée et notarisée Apple, avec clé de licence à vie. La billetterie de vente n'est pas encore ouverte — précommandez pour être prévenu en priorité.

Pour qui

100 % offline, 100 % à vous.

Pour tous ceux qui veulent l'IA locale sans compromis sur la confidentialité, la performance ou le coût d'usage.

⌨️

Développeurs

Branchez Cursor, Continue.dev, Aider sur votre LLM local. Zéro latence réseau, zéro quota, zéro fuite de code propriétaire.

🎨

Studios créatifs

Génération de prompts, brainstorming, analyse de scripts — tout reste sur votre Mac, scénarios confidentiels protégés.

🏢

Entreprises RGPD

Aucune donnée envoyée à un cloud externe par défaut. Conformité RGPD simplifiée, données clients préservées.

🎓

Étudiants & chercheurs

Testez les derniers modèles open-source sans budget cloud. Comparez Qwen, Llama, Mistral en local, sur votre Mac.

Tarifs

Achat unique, sans abonnement.

Une licence à vie, sur le canal de votre choix. Pas de SaaS, pas de carte bancaire récurrente. Mises à jour incluses pendant toute la durée de support de la version majeure achetée.

Mac App Store

49,99 €

Achat unique · version sandboxée réseau local · TVA incluse

Modèles MLX locaux
API OpenAI-compatible (local + LAN)
Monitoring RAM temps réel
Téléchargement direct Hugging Face
Mises à jour macOS incluses

Bientôt sur le Mac App Store

Fiche non publiée à ce jour — l'app est en cours de finalisation avant soumission à Apple.

Téléchargement direct

49,99 €

Achat unique · DMG signé & notarisé Apple · sans les limites du sandbox

Tout ce qui est inclus côté App Store
Accès réseau étendu (au-delà du LAN)
Licence à vie, clé envoyée par email
Support prioritaire par email

Précommande à venir

Boutique de vente en cours de mise en place. Laissez-nous votre email pour être prévenu en priorité.

Soyez prévenu dès l'ouverture des ventes.

Les deux canaux (Mac App Store et téléchargement direct) sont en finalisation. Écrivez-nous pour rejoindre la liste des early adopters — vous serez contacté en priorité à l'ouverture.

Rejoindre la liste d'attente

Aperçu technique

De zéro à inférence locale en 60 secondes.

Une fois installé : choisissez un modèle, copiez la commande dans votre éditeur favori. C'est tout — voici à quoi ressemblera le quick start.

Continue.dev / Cursor / Aider

export OPENAI_API_BASE=http://localhost:8080/v1
export OPENAI_API_KEY=dummy

cd ~/Mon-Projet
aider

curl (test rapide)

curl http://localhost:8080/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-coder-4bit",
    "messages": [{"role":"user","content":"Hello"}]
  }'

Python OpenAI SDK

from openai import OpenAI

client = OpenAI(
  base_url="http://localhost:8080/v1",
  api_key="dummy"
)
client.chat.completions.create(
  model="hermes-3-3b",
  messages=[{"role":"user","content":"Hi"}]
)

FAQ

Les questions qu'on nous pose.

Une réponse manque ? Écrivez-nous — on ajoute la réponse ici.

Quelle configuration Mac est nécessaire ?

Apple Silicon (M1, M2, M3, M4 ou M5), macOS 14 Sonoma ou supérieur, 16 Go de RAM minimum. Pour les modèles 30 B+ (Llama 3.3 70 B, Qwen3-Coder), 64 Go de RAM unifiée sont recommandés.

Quels modèles pourrai-je faire tourner ?

Tous les modèles disponibles au format MLX sur Hugging Face : Qwen 2.5 / 3, Llama 3.x, Mistral, DeepSeek-Coder, Phi-3.5, Hermes-3, et d'autres. Téléchargement direct depuis l'app via le catalogue mlx-community. Les modèles GGUF / Ollama ne sont pas supportés (format différent).

Mes prompts ou conversations seront-ils envoyés quelque part ?

Non. Rien ne quitte votre Mac. Pas de télémétrie, pas de cloud, pas de logs envoyés à DepannOnline. Le seul trafic réseau initié par l'app est le téléchargement des poids de modèle depuis Hugging Face (CDN public), lors du premier chargement. La version App Store reste strictement limitée au réseau local (LAN), jamais Internet.

Compatible avec Continue.dev / Cursor / Aider / Cline ?

Oui — l'API sera strictement OpenAI-compatible (endpoints /v1/models, /v1/chat/completions, streaming SSE). Configuration prévue : OPENAI_API_BASE=http://localhost:8080/v1 et OPENAI_API_KEY=dummy.

Pourquoi deux canaux de distribution (Mac App Store et achat direct) ?

Même prix (49,99 €), même base technique — la différence est le canal. Le Mac App Store offre installation et mises à jour automatiques, mais reste dans le sandbox Apple, limité au réseau local (LAN). L'achat direct fournit un DMG signé et notarisé, hors sandbox, pour un usage réseau plus large (accès distant via un maillage privé type Headscale, par exemple) — licence à vie via lien de téléchargement, mises à jour manuelles. Achat unique dans les deux cas, pas d'abonnement.

L'app fonctionnera-t-elle sur Mac Intel ?

Non. MLX est un framework natif Apple Silicon qui exploite la mémoire unifiée GPU/CPU. Les Mac Intel ne disposent pas de cette architecture.

Y a-t-il une version Windows ou Linux ?

Non, et il n'y en aura pas — MLX est exclusif Apple Silicon. Pour Windows / Linux, tournez-vous vers Ollama, vLLM, ou llama.cpp directement.