Le directeur de xAI et l’homme le plus riche du monde, Ilon Musk, est d’accord avec les experts en IA pour dire qu’il reste très peu de données réelles pour l’entraînement des réseaux neuronaux. Ilya Sutskever, cofondateur d’OpenAI, a exprimé une opinion similaire en décembre.
M. Sutskever a précédemment suggéré que le manque d’informations obligerait les entreprises à reconsidérer les approches traditionnelles de développement des réseaux neuronaux. Musk pense que la solution pourrait résider dans l’utilisation de données synthétiques – des ensembles d’entraînement créés par l’intelligence artificielle elle-même.
De grandes entreprises technologiques telles que Microsoft, OpenAI et Anthropic utilisent déjà des données synthétiques pour entraîner leurs modèles phares. Gartner estime qu’en 2024, 60 % des données utilisées dans les projets d’IA auront été créées artificiellement.
Cette approche est moins coûteuse que les méthodes conventionnelles. Les fondateurs de la startup Writer affirment que leur réseau neuronal Palmyra X 004, développé presque entièrement à partir de données synthétiques, a coûté 700 000 dollars. Comme le note TechCrunch, c’est moins que ce qu’OpenAI a dépensé pour des projets similaires.
Il y a cependant des inconvénients. Les recherches montrent que l’utilisation de données synthétiques peut entraîner une baisse de la créativité et une augmentation des préjugés de l’IA. Cela compromet la qualité de ses performances et de ses fonctionnalités.