Apakah MCP Sudah Mati? Apa yang Kami Pelajari dalam Membangun dengan MCP, CLI, dan Keterampilan Agen
Ketika CTO Perplexity, Denis Yarats, mengatakan di ASK 2026 bahwa perusahaannya tidak memprioritaskan MCP secara internal, hal itu memicu siklus yang biasa terjadi. CEO YC Garry Tan menumpuk - MCP memakan terlalu banyak jendela konteks, auth rusak, dia membangun pengganti CLI dalam 30 menit. Hacker News sangat anti terhadap MCP.
Setahun yang lalu, tingkat skeptisisme publik seperti ini tidak biasa. Model Context Protocol (MCP) diposisikan sebagai standar definitif untuk integrasi alat agen AI. Jumlah server meningkat dua kali lipat setiap minggu. Pola yang terjadi sejak saat itu mengikuti pola yang sudah dikenal: hype yang cepat, adopsi yang luas, kemudian kekecewaan produksi.
Industri ini merespons dengan cepat. Lark/Feishu dari Bytedance membuka sumber CLI resmi mereka - 200+ perintah di 11 domain bisnis dengan 19 Keterampilan Agen bawaan. Google mengirimkan gws untuk Google Workspace. Pola CLI + Keterampilan dengan cepat menjadi standar untuk perkakas agen perusahaan, bukan alternatif khusus.
Di Zilliz, kami telah merilis Zilliz CLI, yang memungkinkan Anda mengoperasikan dan mengelola Milvus dan Zilliz Cloud (Milvus yang dikelola sepenuhnya) langsung dari terminal Anda tanpa meninggalkan lingkungan pengkodean. Selain itu, kami membangun Milvus Skills dan Zilliz Skillssehingga agen pengkodean AI seperti Claude Code dan Codex dapat mengelola basis data vektor Anda melalui bahasa alami.
Kami juga membangun server MCP untuk Milvus dan Zilliz Cloud satu tahun yang lalu. Pengalaman tersebut mengajarkan kami dengan tepat di mana MCP rusak - dan di mana ia masih cocok. Tiga batasan arsitektur mendorong kami ke arah CLI dan Skills: jendela konteks yang membengkak, desain alat pasif, dan ketidakmampuan untuk menggunakan kembali LLM milik agen.
Dalam tulisan ini, kita akan membahas setiap masalah, menunjukkan apa yang kita bangun, dan menyusun kerangka kerja praktis untuk memilih antara MCP, CLI, dan Agent Skills.
MCP Memakan 72% Jendela Konteks Anda saat Startup
Penyiapan MCP standar dapat menghabiskan sekitar 72% dari jendela konteks yang tersedia sebelum agen melakukan satu tindakan pun. Hubungkan tiga server - GitHub, Playwright, dan integrasi IDE - pada model 200K-token, dan definisi alat saja menghabiskan sekitar 143K token. Agen belum melakukan apa pun. Sudah tiga perempat penuh.
Biayanya bukan hanya token. Semakin banyak konten yang tidak terkait yang dikemas ke dalam konteks, semakin lemah fokus model pada apa yang sebenarnya penting. Seratus skema alat yang berada dalam konteks berarti agen mengarungi semuanya dalam setiap keputusan. Para peneliti telah mendokumentasikan apa yang mereka sebut sebagai pembusukan konteks - penurunan kualitas penalaran akibat kelebihan konteks. Dalam pengujian yang terukur, akurasi pemilihan alat turun dari 43% menjadi di bawah 14% seiring dengan bertambahnya jumlah alat. Lebih banyak alat, secara paradoks, berarti penggunaan alat yang lebih buruk.
Akar penyebabnya adalah arsitektural. MCP memuat semua deskripsi alat secara penuh pada awal sesi, terlepas dari apakah percakapan saat ini akan menggunakannya. Itu adalah pilihan desain tingkat protokol, bukan bug - tetapi biayanya meningkat dengan setiap alat yang Anda tambahkan.
Keterampilan agen mengambil pendekatan yang berbeda: pengungkapan progresif. Pada awal sesi, agen hanya membaca metadata setiap Skill - nama, deskripsi satu baris, kondisi pemicu. Total beberapa lusin token. Konten Skill secara lengkap dimuat hanya ketika agen menentukan bahwa itu relevan. Pikirkan seperti ini: MCP membariskan setiap alat di depan pintu dan membuat Anda memilih; Keterampilan memberi Anda indeks terlebih dahulu, konten lengkap sesuai permintaan.
Alat bantu CLI menawarkan keuntungan yang serupa. Seorang agen menjalankan git --help atau docker --help untuk menemukan kemampuan sesuai permintaan, tanpa melakukan pramuat pada setiap definisi parameter. Biaya konteks adalah bayar sesuai penggunaan, bukan di muka.
Pada skala kecil, perbedaannya dapat diabaikan. Pada skala produksi, ini adalah perbedaan antara agen yang bekerja dan agen yang tenggelam dalam definisi alatnya sendiri.
Arsitektur Pasif MCP Membatasi Alur Kerja Agen
MCP adalah protokol pemanggilan alat: cara menemukan alat, memanggilnya, dan menerima hasil. Desain yang bersih untuk kasus penggunaan yang sederhana. Namun, kebersihan itu juga merupakan kendala.
Ruang Alat Datar Tanpa Hirarki
Alat MCP adalah tanda tangan fungsi yang datar. Tidak ada subperintah, tidak ada kesadaran akan siklus hidup sesi, tidak ada rasa di mana agen berada dalam alur kerja multi-langkah. Alat ini menunggu untuk dipanggil. Hanya itu yang dilakukannya.
CLI bekerja dengan cara yang berbeda. git commit, git push, dan git log adalah jalur eksekusi yang sama sekali berbeda yang berbagi satu antarmuka. Seorang agen menjalankan --help, menjelajahi permukaan yang tersedia secara bertahap, dan hanya memperluas apa yang dibutuhkannya - tanpa memuat semua dokumentasi parameter ke dalam konteks.
Keterampilan Menyandikan Logika Alur Kerja - MCP Tidak Bisa
Keterampilan Agen adalah file Markdown yang berisi prosedur operasi standar: apa yang harus dilakukan pertama kali, apa yang harus dilakukan selanjutnya, bagaimana menangani kegagalan, dan kapan harus menampilkan sesuatu kepada pengguna. Agen tidak hanya menerima sebuah alat tetapi juga seluruh alur kerja. Keterampilan secara aktif membentuk bagaimana seorang agen berperilaku selama percakapan - apa yang memicu mereka, apa yang mereka persiapkan sebelumnya, dan bagaimana mereka pulih dari kesalahan. Alat MCP hanya bisa menunggu.
MCP Tidak Dapat Mengakses LLM Agen
Ini adalah batasan yang benar-benar menghentikan kami.
Ketika kami membuat claude-context - sebuah plugin MCP yang menambahkan pencarian semantik ke Claude Code dan agen pengkodean AI lainnya, memberikan mereka konteks yang mendalam dari seluruh basis kode - kami ingin mengambil cuplikan percakapan historis yang relevan dari Milvus dan memunculkannya sebagai konteks. Pengambilan pencarian vektor berhasil. Masalahnya adalah apa yang harus dilakukan dengan hasilnya.
Ambil 10 hasil teratas, dan mungkin 3 di antaranya berguna. Tujuh lainnya adalah noise. Berikan ke-10 hasil tersebut kepada agen luar, dan noise akan mengganggu jawaban. Dalam pengujian, kami melihat jawaban terganggu oleh catatan historis yang tidak relevan. Kami perlu menyaring sebelum meneruskan hasilnya.
Kami mencoba beberapa pendekatan. Menambahkan langkah pemeringkatan ulang di dalam server MCP menggunakan model kecil: tidak cukup akurat, dan ambang batas relevansi membutuhkan penyetelan per kasus penggunaan. Menggunakan model besar untuk perankingan ulang: secara teknis bagus, tetapi server MCP berjalan sebagai proses terpisah tanpa akses ke LLM agen luar. Kami harus mengonfigurasi klien LLM yang terpisah, mengelola kunci API yang terpisah, dan menangani jalur panggilan yang terpisah.
Yang kami inginkan adalah sederhana: biarkan LLM agen luar berpartisipasi secara langsung dalam keputusan pemfilteran. Ambil 10 teratas, biarkan agen itu sendiri yang menilai apa yang layak disimpan, dan kembalikan hanya hasil yang relevan. Tidak ada model kedua. Tidak ada kunci API tambahan.
MCP tidak bisa melakukan ini. Batas proses antara server dan agen juga merupakan batas intelijen. Server tidak dapat menggunakan LLM agen; agen tidak dapat mengatur apa yang terjadi di dalam server. Baik untuk alat CRUD sederhana. Pada saat sebuah alat perlu membuat keputusan, isolasi tersebut menjadi kendala yang nyata.
Keterampilan Agen menyelesaikan hal ini secara langsung. Keterampilan pengambilan dapat memanggil pencarian vektor untuk 10 besar, meminta LLM agen menilai relevansi, dan mengembalikan hanya yang lolos. Tidak ada model tambahan. Agen melakukan pemfilteran itu sendiri.
Apa yang Kami Bangun dengan CLI dan Keterampilan
Kami melihat CLI + Skills sebagai arahan untuk interaksi agen-perangkat - tidak hanya untuk pengambilan memori, tetapi juga di seluruh stack. Keyakinan ini mendorong semua yang kami bangun.
memsearch: Lapisan Memori Berbasis Keterampilan untuk Agen AI
Kami membangun memsearch, sebuah lapisan memori sumber terbuka untuk Claude Code dan agen AI lainnya. Skill berjalan di dalam subagent dengan tiga tahap: Milvus menangani pencarian vektor awal untuk penemuan yang luas, LLM agen itu sendiri mengevaluasi relevansi dan memperluas konteks untuk mendapatkan hasil yang menjanjikan, dan penelusuran akhir mengakses percakapan asli hanya jika diperlukan. Noise akan dibuang pada setiap tahap - sampah pencarian menengah tidak pernah mencapai jendela konteks utama.
Wawasan utama: kecerdasan agen adalah bagian dari eksekusi alat ini. LLM yang sudah ada di dalam loop melakukan pemfilteran - tidak ada model kedua, tidak ada kunci API tambahan, tidak ada penyetelan ambang batas yang rapuh. Ini adalah kasus penggunaan khusus - pengambilan konteks percakapan untuk agen pengkodean - tetapi arsitekturnya menggeneralisasi skenario apa pun di mana alat membutuhkan penilaian, bukan hanya eksekusi.
Zilliz CLI, Keterampilan, dan Plugin untuk Operasi Basis Data Vektor
Milvus adalah basis data vektor sumber terbuka yang paling banyak diadopsi di dunia dengan 43 ribu lebih bintang di GitHub. Zilliz Cloud adalah layanan yang dikelola sepenuhnya oleh Milvus dengan fitur-fitur perusahaan tingkat lanjut dan jauh lebih cepat daripada Milvus.
Arsitektur berlapis yang sama yang disebutkan di atas menggerakkan alat pengembang kami:
- Zilliz CLI adalah lapisan infrastruktur. Manajemen cluster, operasi pengumpulan, pencarian vektor, RBAC, pencadangan, penagihan - semua yang Anda lakukan di konsol Zilliz Cloud, tersedia dari terminal. Manusia dan agen menggunakan perintah yang sama. Zilliz CLI juga berfungsi sebagai fondasi untuk Milvus Skills dan Zilliz Skills.
- Milvus Skill adalah lapisan pengetahuan untuk Milvus sumber terbuka. Ini mengajarkan agen pengkodean AI (Claude Code, Cursor, Codex, GitHub Copilot) untuk mengoperasikan penerapan Milvus apa pun - Milvus Lite, Mandiri, atau Terdistribusi - melalui kode Python pymilvus: koneksi, desain skema, CRUD, pencarian hibrida, pencarian teks lengkap, pipa RAG.
- Zilliz Skill melakukan hal yang sama untuk Zilliz Cloud, mengajarkan agen untuk mengelola infrastruktur cloud melalui Zilliz CLI.
- Plugin Zilliz adalah lapisan pengalaman pengembang untuk Claude Code - membungkus CLI + Skill menjadi pengalaman yang dipandu dengan perintah garis miring seperti /zilliz: quickstart dan /zilliz: status.
CLI menangani eksekusi, Keterampilan menyandikan pengetahuan dan logika alur kerja, Plugin memberikan UX. Tidak ada server MCP di dalam loop.
Untuk lebih jelasnya, lihat sumber-sumber ini:
- Memperkenalkan Zilliz CLI dan Keterampilan Agen untuk Zilliz Cloud
- Zilliz Cloud Baru Saja Mendarat di Kode Claude
- Petunjuk AI - Pusat Pengembang Zilliz Cloud
- Referensi CLI Zilliz - Pusat Pengembang Zilliz Cloud
- Zilliz Skill - Zilliz Cloud Developer Hub
- Milvus untuk Agen AI - Dokumentasi Milvus
Apakah MCP Benar-Benar Sekarat?
Banyak pengembang dan perusahaan termasuk kami di Zilliz beralih ke CLI dan Skill. Tetapi apakah MCP benar-benar sekarat?
Jawaban singkatnya: tidak - tetapi cakupannya menyempit ke tempat yang sebenarnya.
MCP telah disumbangkan ke Linux Foundation. Server aktif berjumlah lebih dari 10.000. Pengunduhan bulanan SDK mencapai 97 juta. Ekosistem sebesar itu tidak akan hilang hanya karena sebuah komentar di konferensi.
Sebuah thread Hacker News - "Kapan MCP masuk akal vs CLI?" - mendapatkan tanggapan yang sebagian besar mendukung CLI: "Alat CLI seperti instrumen presisi," "CLI juga terasa lebih tajam daripada MCP." Beberapa pengembang memiliki pandangan yang lebih seimbang: Keterampilan adalah resep terperinci yang membantu Anda memecahkan masalah dengan lebih baik; MCP adalah alat yang membantu Anda memecahkan masalah. Keduanya memiliki tempatnya masing-masing.
Itu adil - tetapi menimbulkan pertanyaan praktis. Jika resep itu sendiri dapat mengarahkan agen tentang alat mana yang akan digunakan dan bagaimana caranya, apakah protokol distribusi alat yang terpisah masih diperlukan?
Itu tergantung pada kasus penggunaannya.
MCP di atas stdio - versi yang dijalankan oleh sebagian besar pengembang secara lokal - adalah tempat menumpuknya masalah: komunikasi antar proses yang tidak stabil, isolasi lingkungan yang berantakan, biaya token yang tinggi. Dalam konteks tersebut, alternatif yang lebih baik ada untuk hampir setiap kasus penggunaan.
MCP melalui HTTP adalah cerita yang berbeda. Platform perkakas internal perusahaan membutuhkan manajemen izin terpusat, OAuth terpadu, telemetri dan pencatatan standar. Alat CLI yang terfragmentasi benar-benar berjuang untuk menyediakan ini. Arsitektur terpusat MCP memiliki nilai nyata dalam konteks tersebut.
Apa yang sebenarnya dijatuhkan oleh Perplexity adalah kasus penggunaan stdio. Denis Yarats menetapkan "secara internal" dan tidak menyerukan adopsi pilihan tersebut secara luas di seluruh industri. Nuansa itu hilang dalam transmisi - "Perplexity meninggalkan MCP" menyebar jauh lebih cepat daripada "Perplexity mendahulukan MCP daripada stdio untuk integrasi alat internal."
MCP muncul karena memecahkan masalah nyata: sebelumnya, setiap aplikasi AI menulis logika pemanggilan alatnya sendiri-sendiri, tanpa standar bersama. MCP menyediakan antarmuka terpadu pada saat yang tepat, dan ekosistem dibangun dengan cepat. Pengalaman produksi kemudian memunculkan keterbatasan. Itu adalah hal yang normal untuk perkakas infrastruktur - bukan hukuman mati.
Kapan Menggunakan MCP, CLI, atau Keterampilan
| MCP melalui stdio (Lokal) | MCP melalui HTTP (Perusahaan) | |
|---|---|---|
| Otentikasi | Tidak ada | OAuth, terpusat |
| Stabilitas koneksi | Masalah isolasi proses | HTTPS yang stabil |
| Penebangan | Tidak ada mekanisme standar | Telemetri terpusat |
| Kontrol akses | Tidak ada | Izin berbasis peran |
| Pendapat kami | Ganti dengan CLI + Keterampilan | Pertahankan untuk perkakas perusahaan |
Untuk tim yang memilih tumpukan peralatan AI agentic mereka, berikut ini susunan lapisannya:
| Lapisan | Apa yang dilakukannya | Paling cocok untuk | Contoh |
|---|---|---|---|
| CLI | Tugas operasional, manajemen infra | Perintah yang dijalankan oleh agen dan manusia | git, docker, zilliz-cli |
| Keterampilan | Logika alur kerja agen, pengetahuan yang dikodekan | Tugas yang membutuhkan penilaian LLM, SOP multi-langkah | milvus-skill, zilliz-skill, memsearch |
| API REST | Integrasi eksternal | Menghubungkan ke layanan pihak ketiga | API GitHub, API Slack |
| MCP HTTP | Platform alat perusahaan | Penulisan terpusat, pencatatan audit | Gerbang alat internal |
Memulai
Semua yang telah kita bahas dalam artikel ini tersedia saat ini:
- memsearch - lapisan memori berbasis Skills untuk agen AI. Masukkan ke dalam Claude Code atau agen apa pun yang mendukung Skills.
- Zilliz CLI - mengelola Milvus dan Zilliz Cloud dari terminal Anda. Instal dan jelajahi subperintah yang dapat digunakan oleh agen Anda.
- Milvus Skill dan Zilliz Skill - berikan agen pengkodean AI Anda pengetahuan asli Milvus dan Zilliz Cloud.
Ada pertanyaan tentang pencarian vektor, arsitektur agen, atau membangun dengan CLI dan Skill? Bergabunglah dengan komunitas Milvus Discord atau pesan sesi Office Hours gratis untuk membahas kasus penggunaan Anda.
Siap membangun? Daftar ke Zilliz Cloud - akun baru dengan email kantor mendapatkan kredit gratis sebesar $100. Sudah punya akun? Masuk di sini.
Pertanyaan yang Sering Diajukan
Apa yang salah dengan MCP untuk agen AI?
MCP memiliki tiga batasan arsitektur utama dalam produksi. Pertama, MCP memuat semua skema alat ke dalam jendela konteks pada awal sesi - menghubungkan hanya tiga server MCP pada model 200K-token dapat menghabiskan lebih dari 70% konteks yang tersedia sebelum agen melakukan apa pun. Kedua, alat MCP bersifat pasif: alat ini menunggu untuk dipanggil dan tidak dapat mengkodekan alur kerja multi-langkah, logika penanganan kesalahan, atau prosedur operasi standar. Ketiga, server MCP berjalan sebagai proses terpisah tanpa akses ke LLM agen, sehingga alat apa pun yang membutuhkan penilaian (seperti memfilter hasil pencarian untuk relevansi) memerlukan konfigurasi model terpisah dengan kunci API-nya sendiri. Masalah-masalah ini paling parah terjadi pada MCP di atas stdio; MCP di atas HTTP mengurangi beberapa di antaranya.
Apa perbedaan antara MCP dan Keterampilan Agen?
MCP adalah protokol pemanggilan alat yang mendefinisikan bagaimana agen menemukan dan memanggil alat eksternal. Keterampilan Agen adalah file Markdown yang berisi prosedur operasi standar lengkap - pemicu, petunjuk langkah demi langkah, penanganan kesalahan, dan aturan eskalasi. Perbedaan arsitektur yang utama: Keterampilan berjalan di dalam proses agen, sehingga mereka dapat memanfaatkan LLM agen itu sendiri untuk panggilan penilaian seperti pemfilteran relevansi atau pemeringkatan ulang hasil. Alat MCP berjalan dalam proses yang terpisah dan tidak dapat mengakses kecerdasan agen. Skills juga menggunakan pengungkapan progresif - hanya memuat metadata yang ringan saat startup, dengan pemuatan konten penuh sesuai permintaan - menjaga penggunaan jendela konteks minimal dibandingkan dengan pemuatan skema MCP di muka.
Kapan saya masih harus menggunakan MCP alih-alih CLI atau Skills?
MCP melalui HTTP masih masuk akal untuk platform perkakas perusahaan di mana Anda memerlukan OAuth terpusat, kontrol akses berbasis peran, telemetri terstandardisasi, dan pencatatan audit di banyak perkakas internal. Alat CLI yang terfragmentasi kesulitan untuk menyediakan kebutuhan perusahaan ini secara konsisten. Untuk alur kerja pengembangan lokal - di mana agen berinteraksi dengan alat di mesin Anda - CLI + Skills biasanya menawarkan kinerja yang lebih baik, overhead konteks yang lebih rendah, dan logika alur kerja yang lebih fleksibel daripada MCP melalui stdio.
Bagaimana cara kerja alat CLI dan Keterampilan Agen?
CLI menyediakan lapisan eksekusi (perintah yang sebenarnya), sementara Skills menyediakan lapisan pengetahuan (kapan harus menjalankan perintah yang mana, dalam urutan apa, dan bagaimana menangani kegagalan). Sebagai contoh, Zilliz CLI menangani operasi infrastruktur seperti manajemen cluster, koleksi CRUD, dan pencarian vektor. Milvus Skill mengajarkan agen pola pymilvus yang tepat untuk desain skema, pencarian hibrida, dan jalur pipa RAG. CLI melakukan pekerjaan; Skill mengetahui alur kerjanya. Pola berlapis ini - CLI untuk eksekusi, Skill untuk pengetahuan, plugin untuk UX - adalah cara kami menyusun semua perkakas pengembang di Zilliz.
MCP vs Skills vs CLI: kapan saya harus menggunakan masing-masing?
Alat CLI seperti git, docker, atau zilliz-cli adalah yang terbaik untuk tugas-tugas operasional - alat ini mengekspos subperintah hirarkis dan memuat sesuai permintaan. Keterampilan seperti milvus-skill adalah yang terbaik untuk logika alur kerja agen - keterampilan ini membawa prosedur operasi, pemulihan kesalahan, dan dapat mengakses LLM agen. MCP melalui HTTP masih sesuai dengan platform alat perusahaan yang membutuhkan OAuth terpusat, izin, dan pencatatan audit. MCP melalui stdio - versi lokal - digantikan oleh CLI + Skills di sebagian besar pengaturan produksi.
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word



