MCP è già superato? Il vero motivo per cui Anthropic ha spedito le competenze e come abbinarle a Milvus
Nelle ultime settimane è scoppiata una discussione sorprendentemente accesa tra X e Hacker News: Abbiamo davvero bisogno dei server MCP? Alcuni sviluppatori sostengono che MCP sia eccessivamente ingegnerizzato, affamato di token e fondamentalmente non allineato con il modo in cui gli agenti dovrebbero usare gli strumenti. Altri difendono MCP come il modo affidabile per esporre le capacità del mondo reale ai modelli linguistici. A seconda del thread che si legge, l'MCP è il futuro dell'uso degli strumenti, oppure è morto all'arrivo.
La frustrazione è comprensibile. L'MCP offre un accesso robusto ai sistemi esterni, ma costringe il modello a caricare schemi lunghi, descrizioni prolisse ed elenchi di strumenti molto estesi. Questo aggiunge costi reali. Se si scarica la trascrizione di una riunione e successivamente la si inserisce in un altro strumento, il modello potrebbe rielaborare lo stesso testo più volte, gonfiando l'utilizzo dei token senza alcun beneficio evidente. Per i team che operano su scala, questo non è un inconveniente, ma una bolletta.
Ma dichiarare MCP obsoleto è prematuro. Anthropic, lo stesso team che ha inventato MCP, ha introdotto silenziosamente qualcosa di nuovo: le competenze. Le competenze sono definizioni Markdown/YAML leggere che descrivono come e quando uno strumento deve essere usato. Invece di scaricare schemi completi nella finestra del contesto, il modello legge prima i metadati compatti e li usa per pianificare. In pratica, Skills riduce drasticamente l'overhead dei token e offre agli sviluppatori un maggiore controllo sull'orchestrazione degli strumenti.
Questo significa che Skills sostituirà MCP? Non proprio. Le Skill semplificano la pianificazione, ma MCP continua a fornire le funzionalità effettive: lettura di file, chiamata di API, interazione con sistemi di archiviazione o collegamento a infrastrutture esterne come Milvus, un database vettoriale open-source che è alla base di un rapido recupero semantico su scala, rendendolo un backend fondamentale quando le Skill hanno bisogno di un accesso reale ai dati.
Questo post illustra quali sono le abilità che funzionano bene, dove MCP è ancora importante e come entrambi si inseriscono nell'architettura degli agenti in evoluzione di Anthropic. Poi spiegheremo come costruire le proprie Skill che si integrano in modo pulito con Milvus.
Cosa sono e come funzionano le Skill di Anthropic?
Un punto dolente di lunga data degli agenti AI tradizionali è che le istruzioni si esauriscono man mano che la conversazione cresce.
Anche con i suggerimenti di sistema più accurati, il comportamento del modello può gradualmente andare alla deriva nel corso della conversazione. Dopo diversi turni, Claude inizia a dimenticare o a perdere di vista le istruzioni originali.
Il problema risiede nella struttura del prompt di sistema. Si tratta di un'iniezione statica una tantum che compete per lo spazio nella finestra contestuale del modello, insieme alla cronologia della conversazione, ai documenti e a qualsiasi altro input. Man mano che la finestra del contesto si riempie, l'attenzione del modello per il prompt del sistema si diluisce sempre di più, portando a una perdita di coerenza nel tempo.
Le competenze sono state progettate per risolvere questo problema. Le abilità sono cartelle contenenti istruzioni, script e risorse. Invece di affidarsi a un prompt di sistema statico, le abilità suddividono le competenze in pacchetti di istruzioni modulari, riutilizzabili e persistenti che Claude può scoprire e caricare dinamicamente quando è necessario per un compito.
Quando Claude inizia un'attività, esegue innanzitutto una scansione leggera di tutte le Skill disponibili, leggendo solo i loro metadati YAML (poche decine di token). Questi metadati forniscono informazioni sufficienti a Claude per determinare se un'abilità è rilevante per l'attività corrente. In caso affermativo, Claude si espande all'intero set di istruzioni (di solito meno di 5k token) e le risorse o gli script aggiuntivi vengono caricati solo se necessario.
Questa divulgazione progressiva permette a Claude di inizializzare un'abilità con soli 30-50 token, migliorando significativamente l'efficienza e riducendo l'inutile overhead del contesto.
Come le competenze si confrontano con i prompt, i progetti, gli MCP e i subagenti
Il panorama odierno degli strumenti di modellazione può sembrare affollato. Anche solo all'interno dell'ecosistema agenziale di Claude, ci sono diversi componenti distinti: Abilità, prompt, progetti, subagenti e MCP.
Ora che abbiamo capito cosa sono le abilità e come funzionano attraverso i pacchetti di istruzioni modulari e il caricamento dinamico, dobbiamo sapere come le abilità si relazionano con le altre parti dell'ecosistema Claude, in particolare con MCP. Ecco un riassunto:
1. Le competenze
Le abilità sono cartelle che contengono istruzioni, script e risorse. Claude le scopre e le carica dinamicamente utilizzando una divulgazione progressiva: prima i metadati, poi le istruzioni complete e infine i file necessari.
Ideale per:
Flussi di lavoro organizzativi (linee guida del marchio, procedure di conformità)
Competenze di settore (formule Excel, analisi dei dati)
Preferenze personali (sistemi per prendere appunti, schemi di codifica)
Attività professionali che devono essere riutilizzate in tutte le conversazioni (revisioni della sicurezza del codice basate su OWASP).
2. Prompt
I prompt sono le istruzioni in linguaggio naturale fornite a Claude durante una conversazione. Sono temporanei ed esistono solo nella conversazione in corso.
Ideale per:
Richieste una tantum (riassunto di un articolo, formattazione di un elenco)
perfezionamento della conversazione (regolazione del tono, aggiunta di dettagli)
Contesto immediato (analisi di dati specifici, interpretazione di contenuti)
Istruzioni ad hoc
3. Progetti
I progetti sono spazi di lavoro autonomi con una propria cronologia di chat e basi di conoscenza. Ogni progetto offre una finestra di contesto di 200K. Quando la conoscenza del progetto si avvicina ai limiti del contesto, Claude passa senza problemi alla modalità RAG, consentendo un'espansione fino a 10 volte della capacità effettiva.
Ideale per:
Contesto persistente (ad esempio, tutte le conversazioni relative al lancio di un prodotto)
Organizzazione dello spazio di lavoro (contesti separati per le diverse iniziative)
Collaborazione di gruppo (sui piani Team ed Enterprise)
Istruzioni personalizzate (tono o prospettiva specifici di un progetto)
4. Subagenti
I subagenti sono assistenti AI specializzati con le proprie finestre contestuali, richieste di sistema personalizzate e autorizzazioni specifiche per gli strumenti. Possono lavorare in modo indipendente e restituire i risultati all'agente principale.
Ideale per:
Specializzazione dei compiti (revisione del codice, generazione di test, audit di sicurezza)
Gestione del contesto (mantenere la conversazione principale concentrata)
Elaborazione parallela (più subagenti che lavorano contemporaneamente su aspetti diversi)
Limitazione degli strumenti (ad esempio, accesso in sola lettura).
5. MCP (Model Context Protocol)
Il Model Context Protocol (MCP) è uno standard aperto che collega i modelli di intelligenza artificiale a strumenti e fonti di dati esterni.
Ideale per:
Accedere a dati esterni (Google Drive, Slack, GitHub, database).
Utilizzo di strumenti aziendali (sistemi CRM, piattaforme di gestione dei progetti)
Collegamento ad ambienti di sviluppo (file locali, IDE, controllo di versione)
Integrazione con sistemi personalizzati (strumenti e fonti di dati proprietari)
Sulla base di quanto sopra, possiamo vedere che le competenze e gli MCP affrontano sfide diverse e lavorano insieme per completarsi a vicenda.
| Dimensione | MCP | Competenze |
|---|---|---|
| Valore fondamentale | Si connette a sistemi esterni (database, API, piattaforme SaaS) | Definisce le specifiche di comportamento (come elaborare e presentare i dati) |
| Domande a cui si risponde | "A cosa può accedere Claude?" | "Cosa deve fare Claude? |
| Implementazione | Protocollo client-server + schema JSON | File Markdown + metadati YAML |
| Consumo del contesto | Decine di migliaia di token (accumulo di più server) | 30-50 token per operazione |
| Casi d'uso | Interrogazione di grandi database, chiamata alle API di GitHub | Definizione di strategie di ricerca, applicazione di regole di filtraggio, formattazione dell'output |
Prendiamo come esempio la ricerca di codice.
MCP (ad esempio, claude-context): Fornisce la possibilità di accedere al database dei vettori di Milvus.
Competenze: Definisce il flusso di lavoro, come la priorità del codice modificato più di recente, l'ordinamento dei risultati per rilevanza e la presentazione dei dati in una tabella Markdown.
MCP fornisce le capacità, mentre le competenze definiscono il processo. Insieme, formano una coppia complementare.
Come costruire competenze personalizzate con Claude-Context e Milvus
Claude-Context è un plugin MCP che aggiunge la funzionalità di ricerca semantica del codice a Claude Code, trasformando l'intera base di codice nel contesto di Claude.
Prerequisito
Requisiti di sistema:
Node.js: Versione >= 20.0.0 e < 24.0.0
Chiave API OpenAI (per incorporare i modelli)
Chiave APIZilliz Cloud (servizio Milvus gestito)
Passo 1: Configurare il servizio MCP (claude-context)
Eseguire il seguente comando nel terminale:
claude mcp add claude-context \
-e OPENAI_API_KEY=sk-your-openai-api-key \
-e MILVUS_ADDRESS=https://xxxxxxxxx-cn-hangzhou.cloud.zilliz.com.cn \
-e MILVUS_TOKEN=your-zilliz-cloud-api-key \
-e COLLECTION_NAME=medium_articles \
-- npx @zilliz/claude-context-mcp@latest
Controllare la configurazione:
claude mcp list
La configurazione MCP è completa. Claude può ora accedere al database dei vettori di Milvus.
Passo 2: Creare l'abilità
Creare la cartella Skills:
mkdir -p ~/.claude/skills/milvus-code-search
cd ~/.claude/skills/milvus-code-search
Creare il file SKILL.md:
---
name: milvus-code-search
description: A semantic code search and architecture analysis skill designed for the Milvus codebase
---
## Instructions
When the user asks questions related to the Milvus codebase, I will:
1. Code Search : Use semantic search to locate relevant code snippets across the Milvus repository
2. Architecture Analysis : Analyze Milvus’s module structure, component relationships, and design patterns
3. Feature Explanation : Explain how specific features are implemented and how the corresponding logic works
4. Development Guidance : Provide suggestions, best practices, and improvement ideas for modifying the code
## Target Repository
- Core Modules:
<span class="hljs-keyword">internal</span>/ — Core internal components
pkg/ — Public packages and utilities
client/ — Go client implementation
cmd/ — Command-line tools
## Usage Examples
### Architecture Query
User: How does Milvus’s query coordinator work?
Assistant: (searching for querycoordv2) Let me walk you through how the query coordinator operates in Milvus…
### Feature Implementation
User: How does Milvus implement vector indexing?
Assistant: (searching for index code) The vector indexing logic in Milvus is mainly implemented in the following modules…
### Code Understanding
User: What does this function do? (points to a specific file)
Assistant: (analyzing the surrounding code) Based on the context of the Milvus codebase, this function is responsible for…
### Development Guidance
User: How can I add a new vector distance metric to Milvus?
Assistant: (searching for distance implementations) Following the existing pattern, you can add a new distance method by…
## Best Practices
1. Precise Search : Use specific technical terms and module names
2. Contextual Understanding : Interpret code within Milvus’s overall system architecture
3. Actionable Advice : Provide practical, implementation-ready suggestions
4. Performance Awareness : Consider Milvus’s requirements as a high-performance vector database
A custom code-search Skill tailored for the open-source Milvus vector database project.
Passo 3: Riavviare Claude per applicare le competenze
Eseguire il seguente comando per riavviare Claude:
claude
Nota: Una volta completata la configurazione, è possibile utilizzare immediatamente le competenze per interrogare il codice Milvus.
Di seguito un esempio di come funziona.
Interrogazione: Come funziona Milvus QueryCoord?
Conclusione
Le competenze sono un meccanismo per incapsulare e trasferire conoscenze specializzate. Utilizzando le competenze, l'intelligenza artificiale può ereditare l'esperienza di un team e seguire le best practice del settore, che si tratti di una lista di controllo per la revisione del codice o di standard di documentazione. Quando questa conoscenza tacita viene resa esplicita attraverso i file Markdown, la qualità dei risultati generati dall'IA può migliorare in modo significativo.
In prospettiva, la capacità di sfruttare le competenze in modo efficace potrebbe diventare un elemento di differenziazione fondamentale per l'utilizzo dell'IA da parte di team e individui.
Mentre esplorate il potenziale dell'IA nella vostra organizzazione, Milvus è uno strumento fondamentale per la gestione e la ricerca di dati vettoriali su larga scala. Abbinando il potente database vettoriale di Milvus a strumenti di IA come Skills, potrete migliorare non solo i vostri flussi di lavoro, ma anche la profondità e la velocità delle vostre intuizioni basate sui dati.
Avete domande o volete un approfondimento su una qualsiasi funzione? Unitevi al nostro canale Discord per chiacchierare con i nostri ingegneri e con gli altri ingegneri di intelligenza artificiale della comunità. È anche possibile prenotare una sessione individuale di 20 minuti per ottenere approfondimenti, indicazioni e risposte alle vostre domande attraverso Milvus Office Hours.
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word



