Sapien est une « fonderie de données » décentralisée qui exploite la blockchain, la participation d'une communauté mondiale et des incitations économiques pour produire à grande échelle des données d'entraînement spécialisées et de haute qualité destinées aux modèles d'IA. Contrairement aux entreprises traditionnelles d'étiquetage de données, Sapien gamifie les tâches de traitement de données et récompense les participants du monde entier, avec pour objectif de rompre avec le paradigme ancien du contrôle centralisé des données.
Alors que l'IA générative et les grands modèles de langage (LLM) connaissent une croissance fulgurante, la demande en données d'entraînement de qualité explose. Mais les systèmes traditionnels de production de données présentent de graves limites structurelles : les meilleures données sont monopolisées par une poignée de géants de la tech, ce qui les rend chères et difficiles d'accès ; les plateformes de crowdsourcing manquent souvent de mécanismes de confiance solides, entraînant une qualité de données inégale et de mauvais résultats d'entraînement ; surtout, les ensembles de données existants sont largement façonnés par des contextes culturels anglo-américains, ce qui introduit des biais géographiques et culturels qui limitent l'applicabilité mondiale de l'IA.
Face à ces défis, Sapien se positionne comme une « fonderie de données décentralisée » avec une solution en trois volets : décentralisation, incitations économiques et système de réputation. En combinant une infrastructure blockchain, la collaboration d'une communauté mondiale et des récompenses économiques, Sapien construit un réseau ouvert, fiable et qualitatif pour la production de données, conçu pour briser le contrôle centralisé et constituer une infrastructure de base pour l'ère de l'IA.
Sapien a construit une communauté véritablement mondiale, présente dans plus de 110 pays, formant un réseau distribué de « travailleurs de l'IA » appelés Sapiens. Les participants reçoivent des tâches via la plateforme, réalisent l'étiquetage des données et reçoivent des incitations en retour. Cette communauté accomplit plus d'un million de tâches par jour, avec un total cumulé de 80 millions d'éléments étiquetés, couvrant du texte, des images, de l'audio, de la vidéo et des formats complexes en 3D/4D. Le réseau bénéficie également d'un fort effet de réseau : pour chaque tranche de 10 000 utilisateurs supplémentaires, l'efficacité d'exécution des tâches augmente de 8 %, créant un système auto-alimenté de production de données → retour sur la qualité → optimisation des modèles.
Le système de tâches de Sapien est conçu avec des mécaniques de jeu, transformant l'étiquetage de données en une expérience numérique engageante, compétitive et cumulative. Le système repose sur quatre dimensions d'incitation : niveaux, points d'expérience, réputation et défis de tâches.
Les utilisateurs peuvent participer via :
Déverrouillage de tâches : compléter des tâches de base pour gagner des points d'expérience et accéder à des packs de tâches de plus grande valeur (comme l'étiquetage d'imagerie médicale).
Relecture adversariale : s'affronter dans une « arène de l'étiquetage » où les utilisateurs sont en compétition pour la précision. Les meilleurs gagnent des récompenses supplémentaires en tokens.
Système d'identité virtuelle : des projets futurs incluent des badges NFT et des certificats d'accomplissement on-chain, créant une expérience métavers inspirée de StepN.
Une place de marché où les travailleurs de l'IA peuvent accéder à des tâches à la demande telles que le nettoyage de texte, l'étiquetage d'images ou la transcription vocale. Les récompenses et points varient selon la difficulté des tâches.
Un système de vérification en deux temps : après soumission, les tâches sont réaffectées à des utilisateurs QA pour vérification, garantissant la précision et alimentant le score de réputation des participants.
Les entreprises peuvent se connecter à la plateforme Sapien via SDK ou API pour lancer des campagnes de collecte de données sur mesure et recevoir des données structurées et vérifiées pour l'entraînement des LLMs, la conduite autonome, la santé, la finance, etc.
Nom du token : SAPIEN
Points : gagnés en accomplissant des tâches, convertibles ultérieurement en tokens SAPIEN.
Staking : les utilisateurs à forte réputation peuvent staker du SAPIEN pour avoir un accès prioritaire aux tâches et des multiplicateurs de récompenses.
Vote de gouvernance : les détenteurs peuvent voter sur des paramètres de la plateforme comme les taux de récompense ou les types de tâches.
Partage de revenus : une part des revenus futurs issus des entreprises sera redistribuée aux détenteurs de tokens à long terme.
Sapien prévoit de distribuer des airdrops de tokens aux premiers participants et aux principaux contributeurs de tâches.
Selon les critères officiels, la priorité sera donnée aux utilisateurs très actifs, aux étiqueteurs de haute précision, à ceux qui accomplissent des tâches spéciales, aux utilisateurs Web3 affiliés à des guildes reconnues, ainsi qu'aux portefeuilles on-chain actifs ou aux vétérans du réseau Base. Les airdrops devraient être distribués sur la base d'une capture des points avant le lancement du token.
Sapien ne se limite pas à une plateforme d'étiquetage. Son ambition est de devenir la plus grande Data Layer mondiale, servant d'infrastructure de base à l'ère de l'IA : un système de production de données fondé sur le consensus.
1)Lancement du token SAPIEN et du système de staking
2)Expansion du support multi-chain au-delà de Base, vers Solana, Polygon, etc. 3)Lancement de la gouvernance DAO pour permettre à la communauté de co-concevoir les tâches et modèles de revenus
4)Intégration approfondie avec des projets d'IA
Clause de non-responsabilité : ces informations ne constituent ni un conseil en investissement, fiscal, juridique, financier, comptable ou de toute autre nature, ni une incitation à acheter, vendre ou détenir des actifs. MEXC Learn fournit un contenu à titre purement informatif et ne constitue pas un conseil en investissement. Assurez-vous de bien comprendre les risques associés et agissez avec prudence. MEXC décline toute responsabilité quant aux décisions d'investissement des utilisateurs.