En seulement deux jours depuis le lancement, le système a déjà identifié plus de 30 000 comptes suspects. La labellisation manuelle est également efficace, plusieurs centaines d'échantillons sont en cours de processus de validation secondaire.
Ce système de jeu est en fait assez intéressant : l'IA effectue d'abord un premier filtrage, les retours des utilisateurs viennent ensuite compléter les données d'entraînement, et l'équipe technique itère simultanément les règles de reconnaissance. Une fois que ces trois étapes forment une boucle fermée, théoriquement, cela peut ramener la plateforme sociale à son état pur initial - sans armées de faux comptes inondant le fil d'actualités, sans robots spammant.
Ensuite, il faut voir si le volume de données peut soutenir la précision du modèle. Plus il y a d'utilisateurs, plus les échantillons annotés sont riches, et plus la base de règles est complète.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
17 J'aime
Récompense
17
5
Reposter
Partager
Commentaire
0/400
OnchainFortuneTeller
· 11-25 09:02
Wouah, plus de trente mille numéros suspects ? C'est un peu violent là
En seulement deux jours, ils peuvent filtrer autant de choses, cette combinaison d'IA est vraiment redoutable. Mais est-ce qu'on peut vraiment restituer la plateforme dans sa pureté ? Je vais devoir attendre de voir les données
Avoir de plus en plus d'échantillons annotés est une bonne chose, mais j'ai peur que la bibliothèque de règles ne commence à tuer des innocents encore une fois.
Voir l'originalRépondre0
ChainMemeDealer
· 11-25 09:02
30 000 comptes suspects, ça fait un peu dur, je ne sais pas si cela va causer des dommages collatéraux.
En seulement deux jours, ce résultat est intéressant, ce système de boucle fermée est effectivement intrigant, mais j'ai peur que la précision ne suive pas.
La quantité de données est vraiment serrée, plus d'échantillons signifie plus de fiabilité.
Si ce mode de fonctionnement peut vraiment être utilisé, les armées de bots vont avoir des soucis.
La vérification secondaire est un peu prudente, mais le taux d'erreurs collatérales est la clé, non ?
J'ai l'impression qu'il faut attendre de voir comment les itérations vont évoluer, sinon même si la base de règles est améliorée, ça ne servira à rien.
Voir l'originalRépondre0
DeadTrades_Walking
· 11-25 08:59
D’accord, plus de 30 000 comptes filtrés en deux jours, c’est vrai que l’efficacité est impressionnante.
Attends, ça ne risque pas de pénaliser beaucoup de vrais utilisateurs ?
La précision du modèle, au fond, ça dépend toujours de la qualité des échantillons : des données pourries donnent des résultats pourris.
La purification de la communauté, ça sonne bien, mais il ne faudrait pas non plus que ça tourne à la chasse aux sorcières.
S’appuyer sur les retours utilisateurs pour itérer ? Haha, reste à voir combien de gens vont vraiment prendre la peine de taguer sérieusement.
Le bouclage en trois étapes, ça a l’air génial sur le papier, mais pour l’efficacité réelle, j’ai encore des doutes.
Voir l'originalRépondre0
PoolJumper
· 11-25 08:56
Oh là là, encore un système de lutte contre les faux comptes, combien de temps cela va-t-il tenir cette fois ?
---
Plus de 30 000 comptes attrapés en deux jours, ça semble un peu intense, non ?
---
J'ai vu trop de fois cette méthode de boucle fermée, le point clé reste l'exécution.
---
Si la précision du modèle est au maximum, cela peut effectivement rendre les choses beaucoup plus claires, mais comment éviter de blesser de vrais utilisateurs ?
---
Tsk, encore une fois, il faut compter sur les utilisateurs pour annoter les données, n'est-ce pas une forme de crowdsourcing ?
---
30 000 comptes en deux jours, est-ce une lutte contre les faux comptes ou une grande purge ?
---
Plus la base de règles est complète, mieux c'est, mais l'ingénierie inverse sera aussi plus facilement contournée, non ?
---
Je veux juste savoir si ce système a pris en compte la question de la perte d'utilisateurs pendant la période de récession.
---
Pensant que quelques centaines d'échantillons annotés à la main peuvent soutenir l'ensemble du modèle, c'est un peu trop ambitieux, non ?
---
Restaurer l'état pur ? Je pense que c'est peu probable, la chaîne d'intérêts est trop profonde.
Voir l'originalRépondre0
DYORMaster
· 11-25 08:41
Trente mille comptes suspects en deux jours, ce chiffre est un peu fou
---
La logique de boucle fermée est effectivement intelligente, mais la clé est de savoir si la qualité des annotations peut tenir le coup
---
Pourquoi j'ai l'impression qu'on est encore en train de siphonner, un état véritablement pur peut-il être atteint ?
---
Plus il y a d'échantillons, plus la précision est élevée, j'ai entendu cette phrase trop de fois, l'effet réel est la vraie clé
---
Cette fois, les trolls pourraient se retrouver au chômage collectif, haha
---
J'ai juste peur que, dans le processus d'itération, on touche à de vrais utilisateurs, ces validations répétées sont les plus ennuyeuses
---
Trente mille comptes, ça a l'air exagéré, je pense qu'il faudrait mettre un point d'interrogation.
En seulement deux jours depuis le lancement, le système a déjà identifié plus de 30 000 comptes suspects. La labellisation manuelle est également efficace, plusieurs centaines d'échantillons sont en cours de processus de validation secondaire.
Ce système de jeu est en fait assez intéressant : l'IA effectue d'abord un premier filtrage, les retours des utilisateurs viennent ensuite compléter les données d'entraînement, et l'équipe technique itère simultanément les règles de reconnaissance. Une fois que ces trois étapes forment une boucle fermée, théoriquement, cela peut ramener la plateforme sociale à son état pur initial - sans armées de faux comptes inondant le fil d'actualités, sans robots spammant.
Ensuite, il faut voir si le volume de données peut soutenir la précision du modèle. Plus il y a d'utilisateurs, plus les échantillons annotés sont riches, et plus la base de règles est complète.