GADGETS

AWS buka re:Invent 2025 dengan fokus kepada ejen AI sebagai pemacu nilai perniagaan

Najib Aroff 03/12/2025 | 12:27 MYT
Garman menekankan peralihan daripada pembantu AI kepada ejen AI yang boleh berfikir, mengambil tindakan, menggunakan alat, dan mengatur aliran kerja hujung ke hujung. - Gambar/ Astro AWANI
LAS VEGAS: Amazon Web Services (AWS) memulakan persidangan tahunan ke-14 re:Invent di Las Vegas dengan ucaptama Ketua Pegawai Eksekutif, Matt Garman, yang menekankan bahawa ejen AI atau Agentic AI kini menjadi pemacu utama nilai perniagaan dan bukan lagi sekadar teknologi eksperimen.

Garman menekankan peralihan daripada pembantu AI kepada ejen AI yang boleh berfikir, mengambil tindakan, menggunakan alat, dan mengatur aliran kerja hujung ke hujung.

“Akan ada berbilion‑bilion ejen di dalam setiap organisasi,” katanya sambil menekankan impak setaraf internet dan komputasi awan.

“Seluruh cara anda membina aplikasi AI generatif akan berubah dan dicipta semula, inferens ialah blok binaan seterusnya,” kata Garman.

Untuk merealisasikan skala ejen, AWS mengumumkan perluasan GPU NVIDIA generasi baharu pada EC2 P6 serta Trainium 3 UltraServers yang tersedia umum, dengan pratonton Trainium 4 untuk lonjakan prestasi dan kecekapan seterusnya.

Garman menekankan kebolehpercayaan kluster AI berskala gergasi sebagai prasyarat ejen yang responsif dan kos efektif.

Beliau memperkenalkan AWS AI Factories supaya perusahaan dan sektor awam boleh menjalankan infrastruktur AI AWS berdedikasi dalam pusat data mereka sendiri.

Matlamatnya, latensi rendah, kedaulatan data, dan keselamatan setaraf wilayah peribadi untuk ejen yang memproses beban kerja sensitif.

Di lapisan perisian, Amazon Bedrock dikedepankan sebagai platform pengeluaran untuk ejen, dengan pemilihan model luas, penyesuaian, pengawal selia, dan integrasi data serta keselamatan.

Garman berkata puluhan pelanggan sudah memproses beban berskala trilion token bagi kes penggunaan ejen yang intensif.

AWS turut memperkenalkan keluarga Amazon Nova 2, termasuk Nova 2 Lite (penaakulan kos‑optimum), Nova 2 Pro (penaakulan lanjutan untuk ejen), dan Nova 2 Sonic (pertuturan masa nyata), serta Nova 2 Omni yang memahamkan teks, imej, video dan audio dalam satu model untuk ejen multimodal.

“Kami membina model yang ejen boleh gunakan untuk memahami dunia sebenar dan bertindak,” ujar Garman.

Bagi menjadikan ejen benar‑benar berpengetahuan domain, Amazon Nova Forge membolehkan organisasi “mencampur” data proprietari ke dalam titik semak latihan Nova untuk menghasilkan model tersuai (novella) yang mengekalkan penaakulan teras sambil memahami istilah, proses, dan sejarah syarikat secara mendalam.

Ini menyasarkan ejen yang membuat keputusan lebih tepat berasaskan konteks perniagaan sebenar.

Garman berkata, mereka membawa misi “membebaskan pembangun untuk mencipta”.

“Tugas kami ialah menjadikan ejen anda berskala hebat, selamat dan kos efektif, agar idea anda sampai kepada pelanggan dengan pantas,” ujar beliau sambil disaksikan 60,000 peserta secara fizikal dan hampir dua juta penonton dalam talian.



#AMAZON WEB SERVICES #Matt Garman #AWS AI Factories #Agentic AI