AWS dan AI21 Labs mengumumkan ketersediaan keluarga model bahasa besar (LLM) Jamba 1.5 baru yang canggih dari AI21 Labs di Amazon Bedrock. Model-model ini menunjukkan kemajuan signifikan dalam kemampuan bahasa konteks panjang, memberikan kecepatan, efisiensi, dan kinerja di berbagai aplikasi.

Model Jamba 1.5 memanfaatkan arsitektur hibrida unik yang menggabungkan arsitektur model transformator dengan teknologi model Ruang Status Terstruktur (SSM). Pendekatan inovatif ini memungkinkan model Jamba 1.5 untuk menangani jendela konteks panjang hingga 256 ribu token, sambil mempertahankan karakteristik kinerja tinggi dari model transformator tradisional.

Beberapa kekuatan utama dari model Jamba 1.5 meliputi:

* Penanganan konteks panjang: Dengan panjang konteks 256 ribu token, model Jamba 1.5 dapat meningkatkan kualitas aplikasi perusahaan, seperti peringkasan dan analisis dokumen yang panjang, serta alur kerja agen dan RAG.

* Multibahasa: Dukungan untuk Bahasa Inggris, Spanyol, Prancis, Portugis, Italia, Belanda, Jerman, Arab, dan Ibrani.

* Ramah pengembang: Dukungan asli untuk keluaran JSON terstruktur, pemanggilan fungsi, dan mampu mencerna objek dokumen.

* Kecepatan dan efisiensi: AI21 mengukur kinerja model Jamba 1.5 dan membagikan bahwa model tersebut menunjukkan inferensi hingga 2,5 kali lebih cepat pada konteks panjang daripada model lain dengan ukuran yang sebanding.

Model Jamba 1.5 sangat cocok untuk kasus penggunaan seperti analisis dokumen berpasangan, analisis kepatuhan, dan tanya jawab untuk dokumen panjang. Model ini dapat dengan mudah membandingkan informasi dari berbagai sumber, memeriksa apakah bagian-bagian memenuhi pedoman tertentu, dan menangani dokumen yang sangat panjang atau kompleks.

Keluarga model Jamba 1.5 dari AI21 Labs secara umum tersedia hari ini di Amazon Bedrock di Wilayah AWS AS Timur (N. Virginia).

Saya percaya bahwa model-model ini mewakili langkah maju yang signifikan di bidang pemrosesan bahasa. Kemampuan untuk menangani konteks panjang membuka berbagai kemungkinan baru bagi pengembang dan bisnis. Saya sangat antusias untuk melihat aplikasi inovatif apa yang akan dikembangkan menggunakan model-model ini.