OpenAI rakusakan lapisan aplikasi? a16z: peluang di luar "Jalan Kuningan", peluang pengusaha masih di belakangnya

Question

a16z mitra menunjukkan bahwa lapisan aplikasi AI bukanlah medan perang tunggal, perusahaan startup harus menghindari alat horisontal yang langsung ditempuh oleh perusahaan model besar, dan beralih ke industri vertikal untuk pengembangan mendalam. Artikel ini berasal dari posting Twitter.
（Latar belakang: Google memimpin platform routing AI OpenRouter, valuasi 1,3 miliar dolar, tumbuh 240% dalam satu tahun）
（Tambahan latar belakang: Wawancara Sam Altman dengan pendiri a16z: OpenAI akan berinvestasi agresif pada infrastruktur, Sora adalah alat strategi penting）

Daftar isi artikel

Toggle

Kekhawatiran menyebar: Apakah model besar akan menelan lapisan aplikasi?
Jerat jalan batu kuning: Jalan alat horisontal yang pasti mati
Peluang di Oz: Parit perlindungan alur kerja vertikal
Keunggulan biaya: Routing model dan pelatihan pasca
Layar kontrol: Nilai kepatuhan dan tata kelola

Ini adalah pertanyaan yang coba dijawab oleh Joe Schmidt, mitra a16z, dalam artikel ini. Ia menggunakan metafora "Jalan Batu Kuning" dari "The Wizard of Oz" untuk membagi peluang aplikasi AI menjadi dua kategori: satu adalah jalur utama yang sedang diikuti oleh perusahaan model besar, seperti generasi kode, penulisan, pembuatan gambar, agen umum, dan asisten kantor horisontal; yang lain adalah "tempat lain di Oz", yaitu skenario vertikal yang mendalam ke dalam proses industri, bergantung pada alur kerja kompleks, akumulasi data, kepatuhan, tata kelola, dan integrasi sistem.

Menurutnya, peluang nyata bagi startup terletak di kategori kedua.

Dari penjualan hingga asuransi, Joe Schmidt berulang kali menekankan logika yang sama: perusahaan yang benar-benar bersedia membayar bukanlah sebuah jendela obrolan yang lebih pintar, melainkan sebuah sistem yang bertanggung jawab atas hasil bisnis. Sistem ini harus memahami kondisi data pelanggan yang berantakan, menangani persetujuan multi orang dan kasus batas, memikul tanggung jawab kepatuhan dan audit, serta saat model terus diperbarui, menyelesaikan migrasi, routing, dan optimalisasi biaya untuk pelanggan.

Ini juga merupakan inti dari penilaian kami terhadap perangkat lunak perusahaan generasi berikutnya: model dasar akan menjadi semakin kuat dan semakin dapat digantikan; tetapi yang benar-benar tak tergantikan adalah data, proses, kemampuan tata kelola, dan memori operasional yang terakumulasi di sekitar industri dan alur kerja tertentu. Peluang perusahaan aplikasi AI bukanlah dalam bersaing dengan perusahaan model untuk "Jalan Batu Kuning", melainkan masuk ke tempat yang lebih kompleks, lebih kotor, lebih lambat, tetapi juga lebih dekat dengan nilai bisnis nyata.

Baru-baru ini, saya terus mendengar pertanyaan yang sama dari pendiri dan calon karyawan: Apakah lapisan aplikasi AI masih bisa dilakukan? Atau, apakah OpenAI dan Anthropic akhirnya akan menyingkirkan semuanya?

Di balik pertanyaan ini ada semacam kekhawatiran AI yang khas. Ada yang sudah menyimpulkan: jika tidak ingin menjadi lapisan dasar permanen, satu-satunya posisi yang memiliki nilai jangka panjang adalah di dalam laboratorium model besar, atau memulai usaha di bidang robot, teknologi keras, atau bidang frontier serupa—secara teori, melakukan hal-hal yang "tidak bisa dijangkau laboratorium". Karena jika setiap jenis perangkat lunak akan ditelan, entah oleh Codex atau Claude yang langsung menyerap pekerjaan terkait, atau oleh model masa depan yang membuat pekerjaan tersebut tidak lagi diperlukan, pilihan terbaik tampaknya adalah: lari secepat mungkin!

Saya akui, saya hampir seorang ekstremis AI, dan saya pikir mereka benar setengah. Laboratorium model besar memang sedang memasuki wilayah aplikasi yang luas. Tapi "lapisan aplikasi" bukanlah kumpulan peluang yang homogen. Kriteria kunci adalah: apakah kamu sedang mengikuti "Jalan Batu Kuning", atau berada di tempat lain di Oz.

Catatan: "Jalan Batu Kuning" adalah jalur utama menuju pusat kota Emerald di Oz, tempat bertemu "Sang Penyihir", dalam "The Wizard of Oz".

Jalan Batu Kuning adalah metafora untuk jalur yang sedang diikuti laboratorium model besar dan diinvestasikan sumber daya besar-besaran. Generasi kode, penulisan, penciptaan gambar, karena masalah ini secara alami cocok untuk laboratorium, karena mereka akan semakin baik seiring peningkatan kemampuan model asli: setiap dolar yang diinvestasikan dalam pelatihan awal dan pasca langsung meningkatkan kualitas produk.

Namun di tempat lain di Oz, ada masalah yang lebih kompleks dan biasanya lebih vertikal. Mereka bukan sekadar menyediakan alat horisontal untuk pengguna perusahaan agar terhubung ke alat standar dan mampu mengoperasikan komputer. Nilainya lebih banyak berasal dari kerangka kerja di sekitar model: kerangka ini membuat output menjadi terpercaya, patuh, dan benar-benar masuk ke dalam proses bisnis. Kemampuan dasar model tentu penting, tetapi bukan segalanya.

Kita sedang menyaksikan ini secara langsung. OpenAI dan Anthropic sebenarnya sedang mengakui di pasar bahwa mereka tidak bisa menyelesaikan semua masalah dengan satu AI umum. Mereka telah mengumumkan investasi besar dalam proyek joint venture yang berfokus pada konfigurasi dan kustomisasi model untuk perusahaan. Jika mereka yakin bahwa rilis model berikutnya akan menyelesaikan semua ini, mereka tidak akan menginvestasikan miliaran dolar dalam proyek semacam itu.

Kekhawatiran menyebar: Apakah model besar akan menelan lapisan aplikasi?

Jadi, jika ingin menghasilkan uang dari aplikasi AI, jangan mengikuti jalan batu kuning, melainkan bangun di tempat lain di Oz. Berikut pengalaman yang kami dan beberapa pendiri dalam portofolio kami pelajari dari praktik nyata.

Jika ingin mendirikan perusahaan, jalan batu kuning adalah jalur paling mencolok, tetapi juga paling berbahaya. Ambil model berkinerja tinggi, sambungkan dengan beberapa penghubung siap pakai seperti Google Drive, Slack, Salesforce, Notion, GitHub, lalu bangun lapisan orkestrasi cerdas di atasnya. Terlihat seperti sihir.

Masalahnya, ini persis apa yang dilakukan laboratorium model besar melalui Cowork dan Codex. Jelas mereka memiliki model, yang berarti mereka memiliki margin keuntungan lebih baik, kontrol lebih besar, dan kekuatan penetapan harga terhadap semua peserta hilir. Tapi yang lebih penting, mereka juga mengendalikan arsitektur yang menentukan masalah apa yang cocok diselesaikan oleh produk mereka. Sampai saat ini, mereka sangat sengaja mengadopsi pola "model + panggilan alat", yang justru dibutuhkan oleh pekerjaan horisontal dan berjumlah langkah sedikit di jalan batu kuning. Bahkan jika startup mampu melampaui Codex atau Claude Code, laboratorium model besar tetap memiliki jangkauan distribusi yang besar dan aura merek terkuat di bidang AI.

Jika kamu perusahaan aplikasi AI yang mengikuti pola yang sama: menghubungkan penghubung yang sama, tanpa sub-cerita cerdas di bawahnya, tanpa saluran distribusi, kemungkinan besar kamu sedang berjalan ke arah yang tidak pasti.

Namun, bagi startup, situasinya tidak sepenuhnya suram. Di luar jalan batu kuning, peluang besar tetap ada. Startup bisa mendapatkan pelanggan di tempat-tempat ini dan menyelesaikan masalah yang kompleks.

Perusahaan-perusahaan ini membangun pengalaman cerdas: model diintegrasikan ke dalam alat, otomatisasi, dan jaringan integrasi—singkatnya, perangkat lunak. Ini membuat sebagian besar startup ini secara alami menjadi vertikal. Mereka bisa fokus pada alur kerja multi langkah, melibatkan banyak pihak, dan merancang sub-cerita cerdas untuk berbagai peran dan skenario vertikal, mengatasi masalah yang sulit dijangkau platform horisontal dari Anthropic dan OpenAI: mengumpulkan konteks dari berbagai sistem, lalu mengarahkan tugas ke banyak orang yang perlu persetujuan di berbagai tahap.

Pekerjaan semacam ini biasanya melibatkan satu atau lebih sistem warisan, sering membutuhkan hasil yang pasti, karena ketidakpastian tidak dapat diterima, dan kadang-kadang terkait langsung dengan hasil bisnis utama. Laboratorium model besar tentu tahu betapa berharganya masalah ini: itulah sebabnya mereka membangun tim konfigurasi outsourcing sendiri, dan mengapa muncul kelompok perusahaan layanan reinforcement learning yang melayani klien besar.

Satu argumen kontra terhadap pandangan di atas adalah: sampai saat ini, bertaruh pada model atau laboratorium tidak akan terus berkembang, dan itu adalah transaksi yang buruk. Mereka kemungkinan akan terus berkembang dan akhirnya menelan pasar perusahaan aplikasi ini.

Laboratorium model besar pasti akan terus maju. Tapi saya percaya, perusahaan di tempat lain di Oz, dalam jangka panjang, memiliki beberapa cara bertahan.

Banyak hal yang benar-benar kamu internalisasi dalam bisnis tidak ada dalam data pelatihan apa pun: kebiasaan industri yang tidak tertulis, standar tanpa dokumentasi, pengetahuan suku yang tersimpan di kepala para praktisi. Semuanya tidak ada di internet terbuka. Tidak peduli berapa banyak daya komputasi pelatihan yang diinvestasikan, tidak akan bisa menggantikan masuk ke dalam alur kerja tempat pengetahuan itu berada.

Di sinilah dua kekuatan berputar: satu adalah kekuatan berputar antar pelanggan, yaitu semakin banyak variasi masalah yang kamu temui, semakin besar efek pengganda pola; yang lain adalah kekuatan berputar internal pelanggan, yaitu alasan di balik keputusan tertentu, pengecualian yang tidak diungkapkan, dan aturan pengalaman perusahaan sendiri, yang hanya muncul saat pengguna berinteraksi nyata dengan sistem.

Jerat jalan batu kuning: Jalan alat horisontal yang pasti mati

Bahkan jika data pelanggan tidak bisa digunakan lintas pelanggan, perusahaan aplikasi tetap bisa memanfaatkan pola pengenalan masalah berbeda antar pelanggan dan menggunakannya untuk merancang struktur masalah di masa depan. Jika sebuah perusahaan sudah membiarkan smart-nya menangani seratus kali modifikasi garis merah hukum, seribu siklus penilaian asuransi, atau sepuluh ribu aktivitas pengembangan penjualan SDR, pemahamannya terhadap pola masalah tidak bisa diduplikasi oleh pendatang baru yang baru mengaktifkan smart baru.

Secara teori, sebuah smart horisontal juga bisa membangun infrastruktur pembelajaran yang sama. Tapi mereka tidak melakukannya karena alasan selain fokus yang kurang, yaitu pengalaman pengguna. Menangkap pengetahuan ini sepenuhnya bergantung pada bagaimana antarmuka alur kerja yang kamu berikan kepada pengguna. Pemain vertikal bisa merancang antarmuka yang benar-benar menampilkan informasi yang dibutuhkan untuk alur kerja tertentu, sedangkan alat horisontal tidak mampu. Kumpulan evaluasi, penandaan output, sistem klasifikasi kasus batas, semuanya bisa digabung menjadi satu kekuatan data vertikal, dan mendukung fine-tuning lebih lanjut. Pendatang baru tanpa lingkungan produksi yang setara akan sulit membangun kekuatan ini. Keberhasilannya tergantung pada hak atas data, akumulasi penggunaan produksi, dan struktur kontrak pelanggan, tetapi pengenalan pola tetap akan terus bertambah.

Laboratorium model besar sudah melakukan routing: memanggil model berbeda untuk permintaan berbeda, menggunakan integrasi model di tingkat dasar. Tapi mereka tidak mampu melakukan routing antar vendor, dan sulit menilai model pesaing untuk tugas tertentu, atau menggunakan model open source yang paling cocok untuk bagian tertentu.

Perusahaan di tempat lain di Oz akan memilih model paling cocok untuk setiap sub-tugas dari seluruh pasar model, bukan hanya menggunakan model yang dirilis oleh laboratorium induk. Mereka juga akan menangani pekerjaan yang tidak diinginkan orang lain: melakukan evaluasi ulang setiap kali model baru dirilis, menyesuaikan prompt untuk kasus batas pelanggan, dan menyelesaikan peluncuran tanpa merusak lingkungan produksi. Laboratorium model besar tidak akan melakukan ini untuk pelanggan. Mereka menjual model baru dan menyuruh pelanggan melakukan migrasi sendiri. Perusahaan di Oz menyerap biaya migrasi ini. Pelanggan mendapatkan kemampuan cerdas terbaik di pasar, dan kontinuitas selama proses upgrade.

Memberikan setiap query ke Opus 4.7 adalah jalan tercepat menuju margin laba negatif. Perusahaan Oz terbaik akan melakukan routing di antara berbagai tingkat model: tugas paling sulit diserahkan ke model terdepan, sebagian besar tugas ke model menengah, dan di tempat yang sudah terbukti, gunakan model kecil yang disesuaikan atau fine-tuned.

Beberapa perusahaan sudah melakukan pelatihan pasca sendiri, mengoptimalkan model untuk bagian pekerjaan yang benar-benar penting bagi pelanggan, dan menawarkan layanan dengan biaya jauh di bawah API tingkat terdepan. Laboratorium model besar menetapkan harga "lantai": berapa dolar X untuk mendapatkan tingkat kecerdasan minimum. Perusahaan Oz menjual kebalikannya: mencapai tingkat kecerdasan minimum yang benar-benar dibutuhkan dalam alur kerja tertentu dengan biaya dolar terendah. Hanya jika kamu sangat memahami tingkat kecerdasan yang dibutuhkan untuk setiap sub-tugas, ini bisa dilakukan. Laboratorium model besar secara struktural tidak mampu memahami setiap tugas di setiap industri vertikal. Pada akhirnya, ini akan langsung berpengaruh pada penetapan harga hasil yang lebih rendah dan lebih terkendali.

Menjadi layar kontrol bagi pelanggan dalam menjalankan AI di bidang vertikal tertentu akan menghasilkan nilai yang cukup besar. Layar kontrol ini adalah tempat di mana hak akses, audit, apa yang diizinkan dilakukan oleh smart, dan apa yang sebenarnya dilakukan smart, dikumpulkan.

Layar kontrol ini dibangun di atas batasan penggunaan spesifik, dan batasan di berbagai industri serta posisi berbeda sangat berbeda. Karena perusahaan ini memiliki alat, alur kerja, dan data yang diakses smart secara end-to-end, mereka mampu menyediakan hasil yang pasti dengan cara yang sulit dilakukan alat horisontal. Mereka juga akan menyerap kompleksitas regulasi bagi pembeli akhir: aturan litigasi federal AS, aturan praktik pengacara, HIPAA di bidang medis, aturan SEC dan FINRA di keuangan, regulasi asuransi tingkat negara bagian, dan lain-lain. Jika pemain horisontal tidak mengubah dirinya menjadi seratus perusahaan vertikal, mereka tidak akan mampu melakukan ini secara meyakinkan. CIO membutuhkan mitra yang dapat secara kontrak secara tegas menjamin: mereka akan bertanggung jawab atas kepatuhan dan pengelolaan smart yang mereka sediakan.

Semua ini kembali ke satu hal: fokus.

Fokus ini bisa berupa satu industri vertikal, seperti asuransi, hukum, akuntansi; atau satu fungsi yang dilakukan secara mendalam, seperti penjualan, layanan pelanggan, keuangan. Apapun itu, pekerjaan ini membutuhkan tim yang secara konsisten berada di dalam satu jenis pelanggan, memahami alur kerja, kasus batas, dan regulasi mereka. Laboratorium model besar bukanlah tempat untuk ini. Mereka harus melayani semua orang, mencakup semua tempat, dan itulah alasan utama mereka membangun jalan batu kuning. Pilihan yang sama juga akan menyulitkan mereka masuk ke tempat lain di Oz: kamu bisa hadir di mana-mana, atau melakukan satu hal secara mendalam, tapi tidak keduanya sekaligus.

Dalam praktiknya, bagaimana memahami hal ini? Berikut beberapa saran praktis dari CEO 11x, Prabhav Jain.

Peluang di Oz: Parit perlindungan alur kerja vertikal

Membangun perusahaan yang mampu bertahan dari gempuran laboratorium model besar, salah satu strategi yang bisa dilakukan adalah mulai dari hasil konkret yang benar-benar dihargai pelanggan. Bagi kami, hasil ini adalah membantu perusahaan mendapatkan lebih banyak prospek dan pipeline penjualan.

Dari sini, masalah menjadi sangat spesifik: aktivitas apa yang ingin kami miliki secara end-to-end dan benar-benar dapat meningkatkan pertumbuhan pipeline? Pecah aktivitas ini menjadi tugas-tugas. Tugas mana yang cocok untuk smart, mana yang tidak? Mana yang membutuhkan wawasan bidang yang kompleks, mana yang tidak? Laboratorium model besar juga akan meluncurkan alur kerja, tetapi ketika satu alur kerja memiliki banyak langkah, input berantakan, status sulit dijelaskan, atau ada batasan dunia nyata, hanya memiliki model yang lebih baik tidak cukup. Di saat itu, pekerjaan kembali ke rekayasa perangkat lunak tradisional, dan di tingkat ini, laboratorium model besar tidak memiliki keunggulan dibanding perusahaan aplikasi yang fokus.

Sebagai contoh, beberapa tugas yang kami tangani meliputi: pencarian prospek berdasarkan sinyal khusus, pelengkap informasi prospek, riset mendalam tentang akun, pengambilan konteks dari CRM, penulisan informasi untuk berbagai saluran, penilaian kelayakan prospek oleh smart, dan sistem pengiriman email. Beberapa adalah tugas smart, beberapa bukan. Tugas-tugas ini tidak bisa diselesaikan dengan satu prompt saja, melainkan membutuhkan kemampuan rekayasa yang mendalam.

Inti dari analogi Oz adalah: dalam alur kerja nyata, sekitar separuhnya adalah tugas non-smart, dan bagian ini tidak memberi keunggulan laboratorium. Kemampuan menulis perangkat lunak deterministik di bawah model tidak lebih baik dari kamu. Sedangkan setengah lainnya, yang membutuhkan smart, tetap harus berfokus pada hasil yang diinginkan, melakukan tuning, pelatihan, dan pembatasan model.

Pengetahuan bidang seringkali tidak ada dalam data pelatihan umum. Kemampuan ini harus dibangun dari industri vertikal atau fungsi tertentu secara bottom-up, dan diberikan ke model di saat yang tepat dalam alur kerja. Ketika smart kami menilai kelayakan prospek masuk melalui telepon, ia harus dilatih untuk memahami: bagi industri tertentu, gambaran pengguna tertentu, apa yang merupakan percakapan penjualan yang baik. Ini adalah pekerjaan perusahaan aplikasi, dan kemampuan ini akan berlipat ganda secara kompaun.

Lebih penting lagi, kemampuan ini akan terus menjadi usang karena perusahaan sendiri juga berkembang. Jadi, kamu harus terus mengembangkan alur kerja dan konteksnya, dan ini sendiri akan menjadi keunggulan kompetitif. Misalnya, saat kami mulai melakukan produk outreach email otomatis, "email yang ditulis AI" baru mulai muncul. Sekarang, orang sudah punya intuisi tajam untuk membedakan email yang ditulis AI dan yang lebih mirip manusia, dan yang penting, penilaian ini setiap beberapa bulan berubah. Smart kami harus terus menyesuaikan diri dengan dinamika pasar, dan di sinilah kami membangun parit perlindungan. Faktanya, meskipun ada perubahan dinamis ini, tingkat respons positif kami meningkat empat kali lipat dalam beberapa bulan terakhir, dan menciptakan pipeline penjualan bernilai miliaran dolar bagi pelanggan.

Masalah yang kompleks adalah tempat nilai bisnis benar-benar dilepaskan. Kalau tidak, kamu hanya membuat lapisan pembungkus yang tipis.

Membongkar masalah bisnis yang cukup kompleks akan segera menunjukkan kekacauan. Contoh dari bidang GTM yang terdengar sederhana: jika sebuah perusahaan sudah menjadi pelangganmu, kamu seharusnya tidak menghubungi kontak tertentu di perusahaan itu. Tapi ini tidak sesederhana itu.

Mungkin di CRM ada domain perusahaan ini. Bagaimana jika perusahaan tersebut memiliki banyak anak perusahaan? Bagaimana jika CRM mencatat domain induk? Bagaimana jika di Salesforce ada kolom pencocokan usang yang menyebabkan kamu mengirim email penjualan dingin ke chief revenue officer pelanggan yang sudah ada? Data dunia nyata memang berantakan. Manusia pun kesulitan mengatasinya, model pun tidak akan ajaib melewati batas ini. Untuk membangun ketertiban dari kekacauan ini, perlu merancang smart khusus berdasarkan bentuk masalah yang spesifik, bukan sekadar mengarahkan asisten umum ke CRM. Faktanya, berdasarkan data yang kami miliki, kualitas dan keaktualan data kami sudah lebih baik dari data pelanggan sendiri, sehingga secara default, kami menganggap data kami sebagai acuan.

Batasan pengendalian sangat diremehkan. Bahkan dalam satu produk yang sama, setiap kasus penggunaan membutuhkan batasan sendiri. Bagi kami, prospek layanan keuangan yang diatur secara ketat berbeda jauh dari pelanggan SaaS menengah yang membutuhkan jaminan lengkap. Jaminan ini akan mengalir ke cara smart menulis, siapa yang bisa dihubungi, data apa yang bisa diakses, apa yang bisa dikatakan di telepon, dan bagaimana setiap keputusan dicatat.

Sistem "satu ukuran cocok semua" akan gagal menghadapi perbedaan ini. Batasan harus dibangun sesuai kasus penggunaan, dikonfigurasi per pelanggan, dan terus diaudit, semua ini sepenuhnya menjadi tanggung jawab perusahaan aplikasi. Itulah mengapa kita membutuhkan insinyur deployment dan arsitek deployment teknis yang menyesuaikan dengan kebutuhan setiap pelanggan.

Keunggulan biaya: Routing model dan pelatihan pasca

Sebagai contoh, kami pernah bekerja sama dengan sebuah institusi Fortune 1000 yang menggunakan suara untuk melakukan panggilan keluar yang disetujui ke pelanggan SMB mereka. Pada beberapa percobaan awal, tingkat jawaban sangat rendah. Kami harus cepat beradaptasi, belajar bagaimana membuat audiens ini berinteraksi dalam 10 detik sebelum panggilan. Perilaku pemilik bisnis SMB sangat berbeda dari pembeli B2B besar atau konsumen. Sekarang, peluang penjualan yang kami ciptakan untuk mereka dalam satu hari sudah melebihi apa yang tim penjualan mereka hasilkan dalam sebulan di segmen ini.

Penjualan hanyalah satu contoh. Asuransi adalah contoh lain yang menunjukkan hal yang sama dari sudut pandang berbeda. Berikut pemahaman CEO FurtherAI, Aman Gour, tentang "keluar dari jalan batu kuning" dalam konteks ini.

Ketika kami mulai mengintegrasikan AI ke dalam operasi asuransi nyata, satu asumsi yang sering terdengar adalah: model adalah kecerdasan, alur kerja hanyalah kerangka kerja yang dibangun di sekitar model.

Tapi semakin banyak perusahaan asuransi yang kami kerjasamakan, semakin yakin kami bahwa kebalikannya yang benar.

Dalam industri asuransi, banyak kecerdasan sudah ada di dalam alur kerja itu sendiri. Dua perusahaan asuransi bisa saja mengikuti jalur pengajuan yang sama: pengajuan, audit, penawaran, underwriting. Jalur ini sebenarnya mudah. Yang membedakan kedua perusahaan adalah semua hal di dalam jalur itu: risiko mana yang perlu diangkat, sinyal kerugian mana yang penting, saat dua aturan underwriting bertentangan, mana yang diutamakan, kapan harus tanda tangan manusia, data eksternal apa yang harus diambil, dan bagaimana keputusan akhir dicatat.

Logika ini tidak ada dalam mesin aturan yang bersih. Mereka tersebar di proses operasional standar, audit manajer, filosofi underwriting, preferensi risiko khusus perusahaan, dan pengalaman operasional bertahun-tahun. Banyak dari ini tidak tertulis dalam bentuk yang bisa langsung dibaca model.

Itulah sebabnya kami tidak percaya pada smart yang selalu mulai dari nol setiap kali berhadapan dengan kompleksitas nyata, maupun pada alur kerja yang kaku dan langsung runtuh saat menghadapi realitas. Sebaliknya, kami membangun alur kerja smart. Alur ini membawa repetisi, auditabilitas, dan kontrol biaya; smart menangani variabilitas, dan saat jalur utama terganggu, ia akan memulihkan proses; manusia tetap di tempat saat membutuhkan penilaian dan akuntabilitas.

Pada hari pertama, sistem ini otomatisasi pekerjaan manusia. Tapi seiring waktu, setiap upgrade menjadi sinyal, setiap pengecualian menjadi umpan balik, dan setiap koreksi manusia memberi tahu bagian mana dari manual operasi yang tidak lengkap. Lama kelamaan, alur kerja tidak lagi sekadar skrip, melainkan menjadi memori operasional perusahaan asuransi.

Ini adalah bagian yang sulit dijangkau laboratorium model besar. Mereka akan terus merilis model yang lebih baik dan smart yang lebih umum, dan mereka seharusnya melakukannya. Tapi mereka tidak akan tinggal lama di alur kerja produksi perusahaan asuransi, belajar mengapa sebuah akun diupgrade, mengapa risiko ditolak, atau mengapa underwriter membatalkan panduan risiko, dan terbukti mereka benar.

Pemahaman ini hanya bisa datang dari menjalankan satu alur kerja yang sama berkali-kali di lingkungan produksi. Sistem awal yang kamu bangun bukanlah parit perlindungan. Lingkungan penggunaan yang berkembang seiring waktu adalah parit perlindungan itu sendiri.

Ini adalah makna dari "keluar dari jalan batu kuning" bagi kami.

Layar kontrol: Nilai kepatuhan dan tata kelola

Berapa langkah yang dibutuhkan untuk pekerjaan ini? Seberapa kompleks alat yang harus kamu bangun untuk mendukungnya?

Bandingkan dengan pencarian horisontal AI di Google Drive: ini adalah satu langkah operasi terhadap satu alat, dengan toleransi kesalahan yang tinggi. Setelah pengguna membaca ringkasan, jika salah, cukup tanyakan lagi.

Atau, bayangkan sebuah tugas mengubah garis merah hukum secara multi langkah berdasarkan preseden firma hukum selama tiga tahun terakhir: mungkin melibatkan puluhan langkah, banyak alat, output harus melalui review mitra, bahkan mungkin harus diperdebatkan di pengadilan. Keduanya tampak seperti "satu smart yang melakukan pekerjaan", tapi hanya yang kedua membutuhkan perangkat lunak mendalam yang dibangun tim fokus selama bertahun-tahun.

Kamu sedang membangun sistem yang digunakan pelanggan untuk menjalankan pekerjaan mereka, atau menambahkan alat ke sistem yang sudah ada?

Sistem ini memiliki alur kerja end-to-end: penangkapan data, tata kelola, pencatatan pekerjaan selesai. Saat pelanggan menggambarkan bagaimana pekerjaan nyata berlangsung, mereka akan menunjuk ke sistem ini. Alat hanyalah menambah lapisan smart ke alur kerja yang sudah berjalan.

Produk berbasis alat juga bisa menghasilkan pendapatan nyata, tapi laboratorium model besar lebih mudah mengambilnya karena pelanggan tidak bergantung padamu sebagai lapisan orkestrasi. Produk sistem biasanya menunjukkan nilai ACV tinggi, karena menggantikan tenaga manusia nyata dan karenanya bisa dibayar sesuai. Tapi ini bukan jaminan mutlak. Kamu harus bertanya: jika laboratorium model besar merilis produk yang tampaknya bersaing langsung denganmu, apakah pelanggan tetap membutuhkan alatmu? Jika ya, kamu membangun sistem. Jika tidak, kamu hanya alat—meskipun ACV-nya tinggi.

Kinerja laboratorium model besar diukur dengan benchmark; kinerja perusahaan lain di Oz diukur dengan laporan laba rugi pelanggan.

Pelanggan tidak peduli seberapa baik modelmu di SWE-Bench atau MMLU. Mereka peduli apakah smartmu berhasil menutup penjualan, mengubah garis merah kontrak dengan benar, dan mengasuransikan polis yang tepat. Jika mereka fokus pada hasil alur kerja tertentu, bukan skor kemampuan umum, kamu berada di tempat lain di Oz. Jika pelanggan membayar untuk kemampuan umum, berarti kamu menjual apa yang bisa mereka dapatkan dari Claude atau Codex.

Perusahaan smart terbaik harus beroperasi seperti hedge fund: mereka menang di alpha, dan alpha diukur dari laporan laba rugi pelanggan, bukan dari skor benchmark.

Kita akan melihat pemenang besar baik di jalan batu kuning maupun di luar jalan batu kuning. Model akan terus menang karena mereka memiliki model dan kemampuan distribusi yang dirancang untuk alat horisontal.

Perusahaan lain di Oz juga bisa menang, asalkan mereka memiliki sistem pekerjaan: yaitu antarmuka eksekusi pekerjaan perusahaan dan data yang mengalir dan terekam di dalamnya. Perusahaan ini memiliki penangkapan data, sistem alur kerja, dan tata kelola. Seiring berkembangnya alur kerja kompleks di bidang vertikal tertentu, mereka akan membentuk pengalaman inti yang tidak bisa dilepaskan pelanggan. Dengan munculnya model generasi baru dari pemain lama dan baru, perusahaan ini akan menjadi lapisan yang mengintegrasikan dan mengirimkan model-model ini ke pelanggan. Model dasar bisa diganti, tapi sistem pekerjaan tidak.

Perangkat lunak perusahaan generasi berikutnya akan dibangun di luar jalan batu kuning.

Lihat Asli

OpenAI rakusakan lapisan aplikasi? a16z: peluang di luar "Jalan Kuningan", peluang pengusaha masih di belakangnya

Kekhawatiran menyebar: Apakah model besar akan menelan lapisan aplikasi?

Jerat jalan batu kuning: Jalan alat horisontal yang pasti mati

Peluang di Oz: Parit perlindungan alur kerja vertikal

Keunggulan biaya: Routing model dan pelatihan pasca

Layar kontrol: Nilai kepatuhan dan tata kelola

Topik Trending

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USLaunchesNewStrikesOnIranOilRebounds

2gGoldEvery10Minutes

Disematkan