IA en PHP : Arrêtez de croire qu'il faut absolument Python !

Introduction

À tort, on entend souvent la même rengaine : « PHP, c’est vieux, lourd, et clairement moins sexy que React ou Next.js. »

Certes, l’expérience utilisateur (UI), c’est capital. Mais soyons honnêtes… faut-il vraiment trimballer un node_modules de 300 Mo juste pour afficher une page vitrine ? 🤔

Dès qu’on parle d’intelligence artificielle, le réflexe est souvent le même : « Pour faire de l’IA, il faut obligatoirement du Python. »

Eh bien non. PHP n’a pas dit son dernier mot.

Rester ouvert, logique et pragmatique, c’est la clé. Si les LLM (grands modèles de langage comme GPT) font le buzz, le Machine Learning classique (ML) a encore toute sa place pour résoudre des problèmes concrets.

Et devine quoi ? Tu peux très bien entraîner, tester et exploiter de l’IA directement en PHP, sans te convertir au « Pythonisme militant ».

Comprendre les limites (et les forces) de PHP pour l’IA

Soyons lucides : PHP n’est pas conçu pour effectuer des calculs matriciels bas niveau ou gérer des tâches CPU intensives en temps réel comme le ferait du C++ ou du Python (via NumPy).

De plus, l’architecture même de PHP (le modèle Shared Nothing) fait que chaque requête repart de zéro. Contrairement à une application Node.js ou Next.js qui reste en mémoire, PHP recharge son contexte à chaque appel. Est-ce un défaut ? Pas forcément. C’est ce qui rend PHP incroyablement stable et facile à scaler.

Mais cela impose de choisir ses batailles en matière d’IA :

Le Machine Learning (ML) : OUI. On peut faire de la classification, de la régression ou des prédictions (ex: score de spam, estimation de prix) directement en PHP.
Les LLM (Deep Learning) : NON. N’espérez pas faire tourner ou entraîner un modèle type GPT-4 ou Llama-3 directement dans un script PHP. La gestion de la mémoire et la lourdeur des calculs mettraient votre serveur à genoux instantanément.

L’astuce ? L’architecture Asynchrone.

C’est là que le développeur PHP pragmatique se distingue. Si vous lancez un calcul de ML lourd au moment où l’utilisateur charge sa page, vous allez exploser le temps de réponse (et la RAM).

La bonne approche est asynchrone :

L’utilisateur fait une demande.
PHP enregistre la tâche (Job) dans une file d’attente (via Redis/RabbitMQ).
Un Worker traite le calcul ML en arrière-plan.
Le résultat est stocké en base de données, prêt à être servi instantanément via une requête simple.

Ainsi, PHP reste rapide, et l’IA travaille dans l’ombre.

Rubix ML : Le « Cheat Code » pour faire du Machine Learning en PHP

Comment fait-on du ML en PHP concrètement ? Sûrement pas en codant des matrices mathématiques à la main ! Ce serait réinventer la roue, en plus lent et plus complexe. L’objectif ici n’est pas de faire de la recherche fondamentale, mais de répondre à un besoin métier précis.

La réponse tient en deux mots : Rubix ML.

C’est une bibliothèque open-source de haut niveau qui permet d’implémenter des algorithmes complexes sans avoir un doctorat en mathématiques.

Des cas d’usage concrets (sans IA Générative) :

Pas besoin de sortir l’artillerie lourde des Agents IA ou des LLM pour analyser vos données clients. C’est coûteux, lent et souvent overkill. Avec du ML classique, vous pouvez :

Définir les goûts d’un utilisateur (Système de recommandation).
Segmenter votre base clients : Identifier automatiquement les « VIPs » (ceux qui dépensent le plus) ou les utilisateurs à risque de désabonnement (Churn).

L’algorithme clé : K-NN et K-Means

Prenons l’exemple du K-Nearest Neighbors (K-NN). Cet algorithme va regarder les « voisins » les plus proches d’un utilisateur en fonction de ses données. Si l’utilisateur A ressemble à l’utilisateur B et que B a acheté tel produit, alors A aimera probablement ce produit.

C’est simple, efficace, et ça tient dans un script PHP.

⚠️ Rappel vital : Comme vu précédemment, si vous lancez une classification sur 100 000 utilisateurs, n’oubliez pas l’Asynchrone ! On délègue le calcul à un Worker, et on met à jour le profil de l’utilisateur en base de données une fois le traitement fini.

FrankenPHP : Le « Must Have » qui brise les chaînes

Jusqu’ici, nous avons vu que l’IA en PHP est possible en cadrant bien l’usage. Mais si on combinait la robustesse de PHP avec la rapidité d’exécution de Node.js ?

Entrez dans l’arène : FrankenPHP.

Ce serveur d’application moderne, construit sur Caddy et Go, a littéralement explosé en 2025. Il tient une promesse que l’on pensait impossible : rendre PHP performant, scalable et extensible comme jamais auparavant.

La Révolution du « Mode Worker »

Le secret ? Contrairement au PHP traditionnel qui « meurt » après chaque requête, FrankenPHP peut charger votre application en mémoire une seule fois (au démarrage) et la garder active.

Avant (PHP-FPM) : Démarrage du Framework → Chargement des classes → Exécution → Destruction. (Répéter à chaque clic).
Avec FrankenPHP : Démarrage du Framework → Attente des requêtes → Exécution → Exécution → Exécution…

Le résultat ? On divise drastiquement le temps de chargement (le « boot time » disparait).

Pourquoi c’est vital pour le Machine Learning ?

C’est là que ça devient génial pour notre sujet. En ML, ce qui coûte cher, c’est souvent de charger le modèle entraîné (le fichier qui contient la « logique » de l’IA) depuis le disque vers la mémoire. Avec FrankenPHP en mode worker, vous chargez votre modèle ML une seule fois en RAM.

Dès lors, faire une prédiction devient quasi-instantané. On peut enfin envisager du ML en temps réel directement dans le flux de la requête, sans forcément passer par une file d’attente complexe.

Impressionnant ? Oui. Et cela change tout pour l’expérience développeur.

Tutoriel Express : Segmentation client dans Symfony 7

Passons à la pratique. Voici comment implémenter un système capable de grouper vos clients par comportement d’achat (Clustering) directement dans votre application Symfony.

Prérequis : Installez Rubix ML via Composer : composer require rubix/ml

1. Le Service (« Le Cerveau »)

Nous créons un service propre, injectable, qui encapsule la logique de Rubix ML. L’algorithme K-Means va nous permettre de créer des groupes automatiquement.

src/Service/UserProximityService.php

<?php

declare(strict_types=1);

namespace App\Service;

use Rubix\ML\Clusterers\KMeans;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\Kernels\Distance\Euclidean;

/**
 * Service de calcul de proximité des utilisateurs basé sur leur panier moyen.
 */
final class UserProximityService
{
    public function __construct(
        // On peut injecter ce paramètre via services.yaml ou l'autowiring
        private readonly int $numberOfGroups = 3, 
    ) {
    }

    /**
     * Groupe les utilisateurs par proximité de panier moyen (Clustering).
     *
     * @param array<int, float> $userAverageBaskets [userId => averageBasket]
     * @return array<int, array{userId: int, averageBasket: float, group: int}>
     */
    public function groupUsersByBasketProximity(array $userAverageBaskets): array
    {
        if (count($userAverageBaskets) < $this->numberOfGroups) {
            throw new \InvalidArgumentException(
                sprintf('Il faut au moins %d utilisateurs pour créer %d groupes.', $this->numberOfGroups, $this->numberOfGroups)
            );
        }

        // 1. Préparer les données pour Rubix ML (Vectorisation)
        $userIds = array_keys($userAverageBaskets);
        $samples = array_map(
            fn(float $basket): array => [$basket],
            array_values($userAverageBaskets)
        );

        // 2. Créer le dataset (Non supervisé / Unlabeled)
        $dataset = new Unlabeled($samples);

        // 3. Configurer l'IA (K-Means avec distance Euclidienne)
        $clusterer = new KMeans(
            k: $this->numberOfGroups,
            kernel: new Euclidean(),
        );

        // 4. Entraîner et prédire
        $clusterer->train($dataset);
        $predictions = $clusterer->predict($dataset);

        // 5. Remapper les résultats pour le métier
        $results = [];
        foreach ($userIds as $index => $userId) {
            $results[] = [
                'userId' => $userId,
                'averageBasket' => $userAverageBaskets[$userId],
                'group' => $predictions[$index],
            ];
        }

        // Tri pour l'affichage (Optionnel)
        usort($results, function (array $a, array $b): int {
            if ($a['group'] === $b['group']) {
                return $a['averageBasket'] <=> $b['averageBasket'];
            }
            return $a['group'] <=> $b['group'];
        });

        return $results;
    }

    /**
     * Trouve les utilisateurs les plus proches d'un profil cible (Recommandation).
     */
    public function findNearestUsers(
        int $targetUserId,
        array $userAverageBaskets,
        int $k = 1,
    ): array {
        if (!isset($userAverageBaskets[$targetUserId])) {
            throw new \InvalidArgumentException("Utilisateur $targetUserId introuvable.");
        }

        $targetBasket = $userAverageBaskets[$targetUserId];
        $distances = [];

        foreach ($userAverageBaskets as $userId => $basket) {
            if ($userId === $targetUserId) {
                continue;
            }
            // Calcul simple de distance (proche de la logique KNN)
            $distances[] = [
                'userId' => $userId,
                'averageBasket' => $basket,
                'distance' => abs($targetBasket - $basket),
            ];
        }

        usort($distances, fn(array $a, array $b) => $a['distance'] <=> $b['distance']);

        return array_slice($distances, 0, $k);
    }
}

<?php

declare(strict_types=1);

namespace App\Service;

use Rubix\ML\Clusterers\KMeans;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\Kernels\Distance\Euclidean;

/**
 * Service de calcul de proximité des utilisateurs basé sur leur panier moyen.
 */
final class UserProximityService
{
    public function __construct(
        // On peut injecter ce paramètre via services.yaml ou l'autowiring
        private readonly int $numberOfGroups = 3, 
    ) {
    }

    /**
     * Groupe les utilisateurs par proximité de panier moyen (Clustering).
     *
     * @param array<int, float> $userAverageBaskets [userId => averageBasket]
     * @return array<int, array{userId: int, averageBasket: float, group: int}>
     */
    public function groupUsersByBasketProximity(array $userAverageBaskets): array
    {
        if (count($userAverageBaskets) < $this->numberOfGroups) {
            throw new \InvalidArgumentException(
                sprintf('Il faut au moins %d utilisateurs pour créer %d groupes.', $this->numberOfGroups, $this->numberOfGroups)
            );
        }

        // 1. Préparer les données pour Rubix ML (Vectorisation)
        $userIds = array_keys($userAverageBaskets);
        $samples = array_map(
            fn(float $basket): array => [$basket],
            array_values($userAverageBaskets)
        );

        // 2. Créer le dataset (Non supervisé / Unlabeled)
        $dataset = new Unlabeled($samples);

        // 3. Configurer l'IA (K-Means avec distance Euclidienne)
        $clusterer = new KMeans(
            k: $this->numberOfGroups,
            kernel: new Euclidean(),
        );

        // 4. Entraîner et prédire
        $clusterer->train($dataset);
        $predictions = $clusterer->predict($dataset);

        // 5. Remapper les résultats pour le métier
        $results = [];
        foreach ($userIds as $index => $userId) {
            $results[] = [
                'userId' => $userId,
                'averageBasket' => $userAverageBaskets[$userId],
                'group' => $predictions[$index],
            ];
        }

        // Tri pour l'affichage (Optionnel)
        usort($results, function (array $a, array $b): int {
            if ($a['group'] === $b['group']) {
                return $a['averageBasket'] <=> $b['averageBasket'];
            }
            return $a['group'] <=> $b['group'];
        });

        return $results;
    }

    /**
     * Trouve les utilisateurs les plus proches d'un profil cible (Recommandation).
     */
    public function findNearestUsers(
        int $targetUserId,
        array $userAverageBaskets,
        int $k = 1,
    ): array {
        if (!isset($userAverageBaskets[$targetUserId])) {
            throw new \InvalidArgumentException("Utilisateur $targetUserId introuvable.");
        }

        $targetBasket = $userAverageBaskets[$targetUserId];
        $distances = [];

        foreach ($userAverageBaskets as $userId => $basket) {
            if ($userId === $targetUserId) {
                continue;
            }
            // Calcul simple de distance (proche de la logique KNN)
            $distances[] = [
                'userId' => $userId,
                'averageBasket' => $basket,
                'distance' => abs($targetBasket - $basket),
            ];
        }

        usort($distances, fn(array $a, array $b) => $a['distance'] <=> $b['distance']);

        return array_slice($distances, 0, $k);
    }
}

2. La Commande (« L’Exécution »)

Pour tester notre IA, créons une commande Symfony. C’est typiquement ce genre de commande que votre Worker exécuterait en tâche de fond.

src/Command/AnalyzeUsersCommand.php

<?php

declare(strict_types=1);

namespace App\Command;

use App\Service\UserProximityService;
use Symfony\Component\Console\Attribute\AsCommand;
use Symfony\Component\Console\Command\Command;
use Symfony\Component\Console\Input\InputInterface;
use Symfony\Component\Console\Output\OutputInterface;
use Symfony\Component\Console\Style\SymfonyStyle;

#[AsCommand(
    name: 'app:analyze-users',
    description: 'Analyse et segmente les utilisateurs via ML',
)]
class AnalyzeUsersCommand extends Command
{
    public function __construct(
        private readonly UserProximityService $proximityService
    ) {
        parent::__construct();
    }

    protected function execute(InputInterface $input, OutputInterface $output): int
    {
        $io = new SymfonyStyle($input, $output);
        $io->title('🧠 Lancement de l\'analyse IA des paniers clients');

        // Données simulées (viendraient de votre BDD en réalité)
        $userBaskets = [
            1 => 45.50, 2 => 52.00, 3 => 150.00, 4 => 48.00, 5 => 320.00,
            6 => 145.00, 7 => 298.00, 8 => 55.00, 9 => 350.00, 10 => 160.00,
        ];

        // --- 1. Clustering ---
        $io->section('Groupement automatique (Clustering)');
        $groups = $this->proximityService->groupUsersByBasketProximity($userBaskets);

        $currentGroup = null;
        foreach ($groups as $user) {
            if ($currentGroup !== $user['group']) {
                $currentGroup = $user['group'];
                $io->writeln("<info>📦 Groupe {$currentGroup}</info>");
            }
            $io->writeln(sprintf("   User #%d : %.2f €", $user['userId'], $user['averageBasket']));
        }

        // --- 2. Prédictions ---
        $io->section('Recommandation : Qui ressemble au User #5 (320€) ?');
        
        $nearest = $this->proximityService->findNearestUsers(
            targetUserId: 5, 
            userAverageBaskets: $userBaskets, 
            k: 3
        );

        foreach ($nearest as $index => $neighbor) {
            $io->writeln(sprintf(
                "%d. User #%d (%.2f €) - Distance: %.2f €",
                $index + 1, $neighbor['userId'], $neighbor['averageBasket'], $neighbor['distance']
            ));
        }

        $io->success('Analyse terminée avec succès !');
        return Command::SUCCESS;
    }
}

<?php

declare(strict_types=1);

namespace App\Command;

use App\Service\UserProximityService;
use Symfony\Component\Console\Attribute\AsCommand;
use Symfony\Component\Console\Command\Command;
use Symfony\Component\Console\Input\InputInterface;
use Symfony\Component\Console\Output\OutputInterface;
use Symfony\Component\Console\Style\SymfonyStyle;

#[AsCommand(
    name: 'app:analyze-users',
    description: 'Analyse et segmente les utilisateurs via ML',
)]
class AnalyzeUsersCommand extends Command
{
    public function __construct(
        private readonly UserProximityService $proximityService
    ) {
        parent::__construct();
    }

    protected function execute(InputInterface $input, OutputInterface $output): int
    {
        $io = new SymfonyStyle($input, $output);
        $io->title('🧠 Lancement de l\'analyse IA des paniers clients');

        // Données simulées (viendraient de votre BDD en réalité)
        $userBaskets = [
            1 => 45.50, 2 => 52.00, 3 => 150.00, 4 => 48.00, 5 => 320.00,
            6 => 145.00, 7 => 298.00, 8 => 55.00, 9 => 350.00, 10 => 160.00,
        ];

        // --- 1. Clustering ---
        $io->section('Groupement automatique (Clustering)');
        $groups = $this->proximityService->groupUsersByBasketProximity($userBaskets);

        $currentGroup = null;
        foreach ($groups as $user) {
            if ($currentGroup !== $user['group']) {
                $currentGroup = $user['group'];
                $io->writeln("<info>📦 Groupe {$currentGroup}</info>");
            }
            $io->writeln(sprintf("   User #%d : %.2f €", $user['userId'], $user['averageBasket']));
        }

        // --- 2. Prédictions ---
        $io->section('Recommandation : Qui ressemble au User #5 (320€) ?');
        
        $nearest = $this->proximityService->findNearestUsers(
            targetUserId: 5, 
            userAverageBaskets: $userBaskets, 
            k: 3
        );

        foreach ($nearest as $index => $neighbor) {
            $io->writeln(sprintf(
                "%d. User #%d (%.2f €) - Distance: %.2f €",
                $index + 1, $neighbor['userId'], $neighbor['averageBasket'], $neighbor['distance']
            ));
        }

        $io->success('Analyse terminée avec succès !');
        return Command::SUCCESS;
    }
}

Lancez simplement : php bin/console app:analyze-users

La boîte à outils Rubix ML : Quel algorithme pour quel besoin ?

L’un des préjugés tenaces sur PHP est qu’il manque de bibliothèques mathématiques. C’est faux. Rubix ML couvre les quatre piliers majeurs du Machine Learning.

Pour vous aider à choisir, voici un récapitulatif des algorithmes disponibles et de leurs cas d’usage idéaux :

Graphic scheme of a classic machine learning problem – binary classification, regression, clustering, anomaly search. Vector illustration isolated on white background.

Classification (prédire une catégorie)

Exemple : Est-ce un email Spam ou Non-Spam ? Est-ce un client VIP ou Standard ?

Algorithme	Quand l’utiliser	Points forts
Random Forest	Cas général, données mixtes	Robuste, peu de tuning, gère bien le bruit
Gradient Boost	Quand tu veux la meilleure précision	Top performance, mais plus lent
K-Nearest Neighbors	Petits datasets, explicabilité	Simple, intuitif
Naive Bayes	Texte, spam, classification rapide	Ultra rapide, bon en NLP

Régression (prédire une valeur)

Exemple : Quel sera le prix de cet appartement ? Quel sera le chiffre d’affaires le mois prochain ?

Algorithme	Quand l’utiliser	Points forts
Gradient Boost	Précision maximale	Le meilleur en général
Ridge	Relations linéaires, features corrélées	Rapide, stable
Regression Tree	Explicabilité, non-linéaire	Facile à interpréter

Clustering (grouper sans labels)

Exemple : Segmenter une base clients sans savoir à l’avance quels sont les profils.

Algorithme	Quand l’utiliser	Points forts
K-Means	Groupes sphériques, rapide	Simple, efficace
DBSCAN	Formes irrégulières, outliers	Détecte le bruit, pas besoin de K
Mean Shift	Quand tu ne connais pas K	Auto-détecte les clusters

Détection d’anomalies

Exemple : Détecter une fraude bancaire ou une intrusion réseau.

Algorithme	Quand l’utiliser	Points forts
Isolation Forest	Fraude, comportements anormaux	Très efficace, scalable
Local Outlier Factor	Anomalies locales	Précis sur densités variables

Comme vous pouvez le voir, on a largement de quoi faire pour rajouter du Machine Learning « sérieux » dans nos projets PHP, sans avoir à rougir face à l’écosystème Python.

Conclusion : Vers une IA hybride, souveraine et pragmatique

Comme nous l’avons vu tout au long de cet article, utiliser PHP pour de l’IA n’est pas une utopie, c’est un choix d’architecture rationnel pour répondre à un contexte métier.

Certes, Rubix ML ne va pas générer de la poésie ou des images. Il fait des maths. Il reste « simple » et froid. Mais c’est exactement ce qu’on lui demande : de la fiabilité.

Le futur ? L’hybridation avec Symfony AI.

Si on pousse la réflexion plus loin, l’arrivée de composants stables comme Symfony AI change la donne. Imaginez le workflow ultime :

Rubix ML (Local) analyse vos données et sort un score précis (ex: « Client à risque »).
Le LLM (GPT-5, Gemini) reçoit ce contexte structuré via Symfony AI.
Le résultat : Une analyse textuelle parfaite, conceptualisée en direct, sans hallucination, car basée sur vos calculs.

Et même sans aller chercher des LLM externes : vous pouvez très bien générer un rapport PDF complet, incluant vos prédictions ML, le tout localement. C’est la garantie d’une solution souveraine, rapide, et sans dépendance critique au Cloud.

On est loin de la « Hype » de l’IA générative qui crée des images style Ghibli pour le fun. Ici, on parle de ROI (Retour sur Investissement) et de logique métier.

Alors, prêt à installer Rubix ML dans votre prochain projet ?

IA en PHP : Arrêtez de croire qu’il faut absolument Python !