A C program which calculate the most probable word after a chain of words. It feed from a text file and generate a text of 100 words. It work with n-gram and a context of 50 words.
Find a file
2025-06-22 12:30:31 +02:00
base.c Actualiser base.c 2025-05-19 23:39:11 +02:00
LICENSE Initial commit 2025-05-16 12:29:45 +02:00
README.md Actualiser README.md 2025-06-22 12:30:31 +02:00

CAI

CAI est un programme qui permet, à partir d'un texte, de calculer les N mots les plus probables en partant d'un mot aléatoire du texte.

Il n'est pas conçu pour être efficace ou vraiment utile, mais plutôt pour être comparé à des systèmes plus complexes comme les réseaux neuronaux.

Son empreinte mémoire est gigantesque ; il utilise environ 64 \times (\text{nombre de mots}) \times (\text{nombre de mots}) + (\text{nombre de lettres}) \times 8 octets juste pour stocker toutes les informations en RAM (ce qui peut représenter plusieurs GiB).

Build

Le programme utilise la fonction get_entropy() de unistd. Il ne fonctionne donc que sur les systèmes POSIX et se compile normalement sans dépendances supplémentaires sur tous les systèmes POSIX.

Utilisation

Le programme prend un seul paramètre : le chemin du fichier que vous souhaitez utiliser.