6
ejen-ai-pertama-anda
8
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
Pelajaran seterusnya
Pelajaran seterusnya
Dalam pelajaran ini

Memilih Model Bahasa Besar yang akan menggerakkan ejen anda adalah salah satu keputusan teknikal paling penting dalam projek anda.

Ia mempengaruhi prestasi ejen anda, kos operasi, dan sejauh mana tingkah lakunya boleh diramal dari masa ke masa.

Tiada satu model yang terbaik untuk semua. Pilihan yang tepat bergantung pada matlamat anda, bajet anda, dan sejauh mana anda perlukan kawalan ke atas hasilnya.

Pasukan yang membuat keputusan ini secara tergesa-gesa selalunya menyesal kemudian. Kuncinya ialah menguji awal, tetapkan keutamaan yang jelas, dan elakkan terikat dengan satu vendor atau konfigurasi sahaja.

Strategi LLM yang baik menjawab empat soalan utama:

  1. Model mana yang anda gunakan dan mengapa?
  2. Seberapa kerap anda akan menguji alternatif?
  3. Apa yang lebih penting untuk kes penggunaan anda: kelajuan atau keupayaan?
  4. Apakah pelan sandaran anda jika model gagal atau prestasinya menurun?

Mari kita lihat setiap satu daripadanya.

Memilih model adalah soal kesesuaian, bukan populariti. Ada model yang pantas dan murah, ada juga yang lebih perlahan tetapi lebih baik dalam penaakulan kompleks.

Jika kes penggunaan anda melibatkan interaksi pelanggan yang ringkas, kependaman dan kos mungkin lebih penting daripada kedalaman.

Jika kes penggunaan anda memerlukan penaakulan berbilang langkah atau ringkasan terperinci, keupayaan mungkin menjadi keutamaan.

Ujian awal dan kerap membantu anda melihat bagaimana model bertindak balas dengan data sebenar anda. Setiap LLM ada keunikan tersendiri. Ada yang lebih baik dalam mengikuti arahan, ada yang lebih konsisten dari segi nada atau ketepatan. Anda hanya boleh mengetahuinya melalui contoh sebenar dari aliran kerja anda sendiri.

Perancangan sandaran sama pentingnya. Walaupun API yang paling stabil kadang-kadang berubah tingkah laku, menurun prestasi, atau tidak boleh diakses. Sentiasa tetapkan model sandaran dan polisi untuk beralih apabila prestasi jatuh di bawah tahap minimum anda. (Atau pastikan pembina ejen anda menyediakan pilihan sandaran lalai, seperti yang ditawarkan oleh Botpress)

Di Terminal Roast, Ross, akauntan, membuat kira-kira. Pasukan mahu ejen mereka mengendalikan perbualan pelanggan ringkas tentang kopi dan pastri tanpa kelewatan yang ketara. Selepas menguji beberapa pilihan, mereka memilih Gemini 2.5 Flash. Ia pantas, murah, dan cukup berkuasa untuk perbualan santai dengan pelanggan.

Untuk sandaran, mereka tetapkan sistem supaya beralih ke model kedua jika kependaman atau kadar ralat melebihi ambang yang ditetapkan. Pilihan ini memastikan pengalaman pengguna lancar dan kos operasi dapat dijangka.

Ross mencatat bahawa jika mereka ingin memperluaskan ejen kepada tugas yang lebih kompleks pada masa akan datang, mereka boleh menilai semula pilihan model.

Setiap keputusan model juga adalah keputusan perniagaan. Pilihan yang salah boleh menggandakan kos operasi anda atau menyebabkan kelewatan yang tidak perlu dalam interaksi pengguna. Pilihan yang betul mengimbangi prestasi dan kos mengikut pengalaman yang anda ingin berikan.

Fleksibiliti juga sama penting. Elakkan mereka bentuk sistem anda terlalu bergantung pada satu model sehingga sukar untuk beralih kemudian. Gunakan lapisan abstraksi atau vendor yang menyokong pelbagai model supaya anda boleh menyesuaikan diri apabila landskap berubah.

Fleksibiliti ini memastikan sistem anda tahan lasak dan anda tidak bergantung sepenuhnya pada pelan pembangunan atau model harga satu penyedia sahaja.

Untuk membina strategi LLM sebenar, dokumenkan tiga perkara:

  • Model utama anda dan sebab ia dipilih.
  • Ambang prestasi dan kos anda untuk menentukan bila perlu beralih.
  • Model sandaran anda dan peraturan untuk mengaktifkannya.

Kaji semula keputusan ini sekurang-kurangnya setiap suku tahun. Perubahan dalam ekosistem LLM sangat pantas, dan model baharu selalunya mengatasi yang lama dengan kos lebih rendah. Anggap ini sebagai penilaian berterusan, bukan sekali sahaja.

Keputusan Terminal Roast untuk mengutamakan kelajuan dan kebolehjangkaan berbanding keupayaan maksimum adalah sebab pelancaran pertama mereka mampan. Ia memastikan pelanggan berpuas hati, kos terkawal, dan mereka boleh mengumpul data dunia sebenar tanpa ketidakstabilan teknikal.

Keseimbangan itu — memilih model yang sesuai, merancang untuk perubahan, dan mengekalkan fleksibiliti — adalah apa yang membezakan projek percubaan daripada projek sebenar.

Strategi LLM anda seharusnya sentiasa menyokong matlamat perniagaan anda, bukan menentukan arah tuju perniagaan.

Tindakan: Catat model yang anda rancang untuk digunakan, apa yang paling penting untuk kes penggunaan anda (kelajuan, kos, atau kedalaman), dan apakah pilihan sandaran anda. Semak semula pilihan ini secara berkala apabila anda mengumpul data penggunaan.

Ringkasan
Bagaimana memilih model bahasa besar (LLM) yang sesuai untuk ejen AI berdasarkan prestasi, kos, kependaman, dan kebolehpercayaan jangka panjang.
semua pelajaran dalam kursus ini
Fresh green broccoli floret with thick stalks.