Berita dari CoinWorld pada 29 Juli, Zhipu AI secara resmi meluncurkan seri model flagship GLM-4.5, termasuk dua versi GLM-4.5 dan GLM-4.5-Air. Di antaranya, GLM-4.5 memiliki total parameter mencapai 355 miliar, dengan parameter aktif 32 miliar; GLM-4.5-Air memiliki total parameter 106 miliar, dengan parameter aktif 12 miliar, keduanya menggunakan arsitektur pakar campuran dan mendukung jendela konteks 128K. Model baru ini mendapatkan peringkat kedua secara global dan pertama di dalam negeri dalam rata-rata skor dari 12 evaluasi benchmark, serta untuk pertama kalinya berhasil mengintegrasikan kemampuan inferensi, pengkodean, dan agen secara asli. Harga panggilan API mulai dari input 0.8 yuan/ juta tokens, output 2 yuan/juta tokens, dengan kecepatan generasi versi cepat melebihi 100 tokens/detik.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Zhipu AI meluncurkan model flagship seri GLM-4.5
Berita dari CoinWorld pada 29 Juli, Zhipu AI secara resmi meluncurkan seri model flagship GLM-4.5, termasuk dua versi GLM-4.5 dan GLM-4.5-Air. Di antaranya, GLM-4.5 memiliki total parameter mencapai 355 miliar, dengan parameter aktif 32 miliar; GLM-4.5-Air memiliki total parameter 106 miliar, dengan parameter aktif 12 miliar, keduanya menggunakan arsitektur pakar campuran dan mendukung jendela konteks 128K. Model baru ini mendapatkan peringkat kedua secara global dan pertama di dalam negeri dalam rata-rata skor dari 12 evaluasi benchmark, serta untuk pertama kalinya berhasil mengintegrasikan kemampuan inferensi, pengkodean, dan agen secara asli. Harga panggilan API mulai dari input 0.8 yuan/ juta tokens, output 2 yuan/juta tokens, dengan kecepatan generasi versi cepat melebihi 100 tokens/detik.