News | Gate.com

Mac Studio : tests en conditions réelles de modèles à grande échelle : attente pour M3 Ultra, solutions en cluster et M5 Ultra

En avril 2026, des modèles de niveau 1 兆 paramètre, tels que DeepSeek V4 Pro, Kimi K2.6, etc., ont été publiés les uns après les autres, rendant l’idée de « faire tourner un LLM open-source de pointe sur sa propre machine » une option viable. Pour les ingénieurs et les petites équipes qui ne veulent pas construire une station de travail H100, mais qui souhaitent disposer de capacités complètes d’inférence locale, \\Mac Studio M3 Ultra 256GB\\ est, à ce stade, la solution mono-machine la plus rentable, avec, en complément, un cluster via Thunderbolt 5 permettant d’aller jusqu’à des domaines de 1T paramètres. Cet article regroupe des données d’expérimentation sur l’exécution de modèles à grande échelle avec le M3 Ultra, des solutions de cluster, les avantages du framework MLX, ainsi que le calendrier prévu pour le M5 Ultra. État actuel des spécifications du M3 Ultra : mémoire unifiée de 256GB, 819

ChainNewsAbmedia·04-27 11:14

DeepSeek V4 Pro sur Ollama Cloud : connectez Claude Code en un clic

Agent IA

Actualités de l’industrie de l’IA

Outils et apps IA

Selon les tweets d’Ollama, DeepSeek V4 Pro a été publié le 24/04, et est désormais intégré au répertoire d’Ollama en mode cloud. Une seule commande suffit pour appeler des outils tels que Claude Code, Hermes, OpenClaw, OpenCode, Codex, etc. V4 Pro : 1,6T paramètres, 1M context, Mixture-of-Experts ; l’inférence via le cloud ne télécharge pas les poids sur votre appareil local. Pour l’utiliser localement, il faut récupérer les poids et les exécuter avec INT4/GGUF et plusieurs GPU. Les tests de vitesse initiaux ont été influencés par la charge du cloud : le débit normal est d’environ 30 tok/s, le pic à 1,1 tok/s. Il est recommandé de l’utiliser d’abord via le prototype cloud ; pour la production en série, effectuez ensuite votre propre inférence ou utilisez une API commerciale.

ChainNewsAbmedia·04-27 06:34

Cloud Tencent QClaw connecte le framework Hermes, prend en charge le basculement entre plusieurs modèles, comme DeepSeek-V4 Pro

Agent IA

Outils et apps IA

Selon l’annonce officielle de Tencent Cloud du 27 avril, l’outil de bureau QClaw de l’IA Agent de Tencent Cloud est officiellement publié dans sa version v0.2.14. Tencent Cloud indique que cette mise à niveau est la plus importante de QClaw à ce jour. Les mises à jour principales comprennent l’intégration du framework Hermes Agent, la mise à niveau du modèle de base vers un mode de basculement libre, ainsi que la mise à niveau complète de « Inspiration Plaza » en « Expert Plaza ».

MarketWhisper·04-27 05:26

DeepSeek V4-Flash arrive sur Ollama Cloud, hôtes américains : Claude Code, OpenClaw connexion en un clic

Actualités de l’industrie de l’IA

Outils et apps IA

Ollama Cloud a mis en ligne DeepSeek V4-Flash, avec l'inférence sur des serveurs aux États-Unis, et propose trois ensembles de commandes en un clic pour se connecter à Claude Code, OpenClaw et Hermes. V4-Flash/V4-Pro utilisent une architecture MoE, avec une prise en charge native du contexte 1M, et réduisent les coûts grâce à une compression Token-wise + une attention clairsemée DSA ; dans un scénario de 1M, les FLOPs par token diminuent de 27 % et le cache KV baisse de 10 %. L'API est compatible avec OpenAI ChatCompletions et Anthropic, ce qui facilite le basculement entre plusieurs flux de travail, réduit les coûts et les risques liés à la souveraineté des données.

ChainNewsAbmedia·04-24 10:45

DeepSeek lance une version d’aperçu open source V4, avec une note technique de 3206 dépassant GPT-5.4

Actualités de l’industrie de l’IA

DeepSeek a officiellement lancé le 24 avril une série de préversion de V4, sous licence MIT et publiée en open source, avec des poids de modèle mis en ligne sur Hugging Face et ModelScope. D’après le rapport technique de DeepSeek V4, V4-Pro-Max (mode avec le plus haut niveau de puissance d’inférence) a obtenu 3206 points sur le benchmark Codeforces, dépassant GPT-5.4.

MarketWhisper·04-24 05:38

OpenAI lance GPT-5.5 : 12M de contexte, l’indice AA atteint le sommet, Terminal-Bench 82,7 % reconfigure la référence des agents

Agent IA

Actualités de l’industrie de l’IA

OpenAI publie GPT-5.5, axé sur le travail basé sur des agents et le traitement des connaissances en entreprise, et le lance simultanément dans ChatGPT et Codex. Les points clés incluent une fenêtre contextuelle de 12 millions de tokens, l’AA Intelligence Index 60, en avance sur Claude Opus 4.7 et Gemini 3.1 Pro ; le prix est de 5 dollars pour l’entrée de 1 million de tokens et de 30 dollars pour la sortie de 1 million de tokens, la sortie de tokens diminuant d’environ 40 %, tandis que le coût réel augmente d’environ 20 %.

ChainNewsAbmedia·04-23 19:45

Claude Code annonce le retrait de l’offre Pro et indique qu’il faut s’abonner à Max ! Un dirigeant d’Anthropic affirme que tout est encore en phase de test

Actualités de l’industrie de l’IA

Récemment, plusieurs utilisateurs ont constaté que le site officiel d’Anthropic supprimerait apparemment Claude Code de l’offre Pro (20 dollars/mois), pour le remplacer par Max (à partir de 100 dollars/mois). Officiellement, ils indiquent qu’il s’agit uniquement d’un test visant environ 2 % des inscriptions prosumer nouvellement ajoutées, et que les utilisateurs Pro et Max existants ne sont pas concernés. Cette mesure est considérée comme une réévaluation des coûts et de la stratégie de tarification des fonctionnalités très gourmandes en ressources, et il est possible qu’à l’avenir ces fonctionnalités soient extraites des offres grand public, afin d’adopter une tarification échelonnée à des niveaux de prix plus élevés.

ChainNewsAbmedia·04-22 04:34

Google dévoile Deep Research Max : prise en charge de MCP, accès aux données privées des entreprises

Agent IA

Actualités de l’industrie de l’IA

Selon l’annonce officielle du blog de Google DeepMind, Google a lancé, le 21 avril 2026, sa nouvelle génération d’agents de recherche autonomes, Deep Research et Deep Research Max, construite sur Gemini 3.1 Pro, et faisant suite à la version preview fournie en décembre 2025 via l’Interactions API. Les deux agents sont désormais disponibles, sous forme de public preview, dans l’offre payante de l’API Gemini, et les utilisateurs startups et entreprises de Google Cloud les intégreront progressivement. Les deux variantes ont des positionnements différents : interactif vs profondeur asynchrone Google distingue les deux agents selon les cas d’utilisation : Deep Research

ChainNewsAbmedia·04-21 18:14

Artefacts en direct de Claude : le tableau de bord se connecte directement à l’application et se met à jour automatiquement en temps réel

Actualités de l’industrie de l’IA

Selon l’annonce officielle d’X de Claude, Anthropic a lancé, le 20 avril, la fonctionnalité Live Artifacts dans Cowork, l’application de bureau de Claude. Elle permet aux graphiques, tableaux de bord et suiveurs générés par l’IA de se connecter directement aux applications et fichiers de l’utilisateur, et d’être actualisés automatiquement avec les dernières données lors de leur ouverture. Live Artifacts est disponible pour tous les utilisateurs de Cowork des offres payantes de Claude (Pro, Max, Team, Enterprise). Fonctionnalités clés de Live Artifacts : passer des sorties statiques à un lien en temps réel Auparavant, une fois les Claude Artifacts générés, ils se retrouvaient déconnectés de la réalité — si l’utilisateur souhaite mettre à jour les données, il ne peut que coller à nouveau les données et demander à Claude de régénérer une nouvelle version. L

ChainNewsAbmedia·04-21 07:45

Contourner les règles de la FSC pour acheter des cryptos par carte bancaire serait-il possible ? Oding Ding propose un service d’achat de cryptos via la carte bancaire américaine Wallet Pro

Partenariats & Écosystème

Réglementation et politiques

Les services OwlPay et Wallet Pro lancés par OdinLink utilisent la technologie des stablecoins pour permettre des paiements transfrontaliers B2B, et s’associent à de grands acteurs internationaux des paiements, démontrant ainsi ses ambitions d’expansion dans le domaine de la fintech. En opérant depuis l’étranger, OdinLink contourne les restrictions réglementaires de Taïwan, propose des échanges d’actifs virtuels rapides et, tout en faisant face à la nouvelle loi sur les services d’actifs virtuels, pourrait à l’avenir devenir un modèle de référence pour d’autres entreprises étrangères entrant sur le marché taïwanais.

CryptoCity·04-15 10:59