Vertex AI Kini Makin Lengkap, dari Musik Hingga Video
Jakarta: Dalam ajang Next' 25, Google Cloud mengumumkan perluasan kemampuan Vertex AI. Kini, Vertex AI menjadi platform tunggal yang menawarkan model media generatif lengkap yang mencakup video, gambar, suara, dan kini, musik dengan diperkenalkannya Lyria.
Pengumuman ini disampaikan oleh Warren Barkley, Senior Director of Product Management, yang menekankan komitmen Google dalam berinvestasi pada media generatif. “Kami terus berinvestasi dalam media generatif dengan menambahkan Lyria, model text-to-music Google, ke Vertex AI dalam pratinjau dengan daftar izin. Dengan penambahan musik, Vertex AI sekarang menjadi satu-satunya platform dengan model media generatif di semua modalitas – video, gambar, suara, dan musik,” ujarnya.
Integrasi Lyria memungkinkan pengguna untuk membangun aset siap produksi yang lengkap, mulai dari perintah teks, hingga gambar, hingga aset video lengkap dengan musik dan suara. Ini membuka peluang baru bagi para kreator konten, pemasar, dan pengembang untuk menghasilkan materi yang lebih kaya dan beragam dengan lebih efisien.
Lyria
Lyria, model text-to-music terbaru dari Google, mampu menghasilkan audio dengan fidelitas tinggi, menangkap nuansa halus, dan menghasilkan komposisi yang kaya dan detail di berbagai genre musik. Perusahaan dapat dengan cepat membuat soundtrack untuk kampanye pemasaran, peluncuran produk, atau pengalaman di dalam toko yang mendalam, semuanya disesuaikan dengan identitas unik merek mereka. Lyria memungkinkan penciptaan branding sonik yang sangat beresonansi dengan target audiens, memupuk hubungan emosional dan meningkatkan daya ingat merek.
Untuk produksi video, podcasting, dan pembuatan konten digital, menemukan musik bebas royalti yang sempurna bisa menjadi proses yang memakan waktu dan mahal. Lyria menghilangkan hambatan ini, memungkinkan pengguna untuk menghasilkan trek musik khusus dalam hitungan menit, selaras langsung dengan suasana hati, kecepatan, dan narasi konten mereka. Ini dapat membantu mempercepat alur kerja produksi dan mengurangi biaya lisensi.
Veo 2
Google Cloud juga meluncurkan fitur dan pembaruan baru untuk meningkatkan model media generatif lainnya Model pembuatan video Veo 2 kini dilengkapi fitur pengeditan dan kontrol kamera baru yang tersedia dalam pratinjau dengan daftar izin.
Fitur ini membantu pengguna untuk menyempurnakan dan menggunakan kembali konten video dengan presisi, memberikan kontrol kreatif yang lebih besar, mempercepat iterasi, menghasilkan konten berkualitas lebih tinggi, dan mengurangi waktu serta biaya pasca-produksi.
Beberapa kemampuan terbaru Veo 2:
Inpainting: Mendapatkan editan yang bersih dan profesional tanpa sentuhan manual. Pengguna dapat menghapus gambar latar belakang, logo, atau gangguan yang tidak diinginkan dari video, membuatnya menghilang dengan mulus dan sempurna di setiap frame.
Outpainting: Memperluas bingkai rekaman video yang ada, mengubah video tradisional menjadi format yang dioptimalkan untuk platform web dan seluler.
Menerapkan teknik sinematik yang canggih: Fitur baru termasuk mengarahkan komposisi bidikan, sudut kamera, dan kecepatan yang membantu tim menggunakan teknik sinematik yang canggih dengan mudah, tanpa memerlukan perintah yang kompleks atau keahlian khusus.
Membuat video yang kohesif dengan menghubungkan dua aset yang ada (interpolasi): Dengan interpolasi, pengguna dapat menentukan awal dan akhir urutan video, memungkinkan Veo untuk menghasilkan frame penghubung dengan mulus.
Chirp 3
Model pemahaman dan pembuatan audio terobosan Chirp 3 kini menyertakan Instant Custom Voice, cara baru untuk membuat suara khusus hanya dengan 10 detik input audio. Pengguna juga dapat menenun narasi bertenaga AI ke dalam rekaman yang ada, dan menambahkan kemampuan transkripsi ucapan yang dapat membedakan antara pembicara. Kedua fitur ini tersedia melalui pratinjau dengan daftar izin.
Chirp 3 sekarang menawarkan Instant Custom Voice, yang memungkinkan pembuatan suara khusus yang realistis dari 10 detik input audio. Fitur ini memungkinkan perusahaan untuk mempersonalisasi pusat panggilan, mengembangkan konten yang dapat diakses, dan membangun suara merek yang unik—semuanya sambil mempertahankan identitas merek yang konsisten.
Selain itu, Chirp 3: Transcription with Diarization sekarang tersedia dalam pratinjau dengan daftar izin, yang secara akurat memisahkan dan mengidentifikasi masing-masing pembicara dalam rekaman multi-pembicara.
Imagen 3
Model text-to-image berkualitas tertinggi Imagen 3 kini memiliki kemampuan pembuatan gambar dan inpainting yang ditingkatkan untuk merekonstruksi bagian gambar yang hilang atau rusak. Pembaruan terbaru ini secara signifikan meningkatkan kualitas penghapusan objek, memberikan pengalaman pengeditan yang lebih alami dan mulus.
Imagen 3 telah mengalami peningkatan besar dalam setahun terakhir, dengan kemampuan menghasilkan gambar dengan detail yang lebih baik, pencahayaan yang lebih kaya, dan artefak yang mengganggu lebih sedikit.
Pengeditan Imagen 3 menyediakan cara yang ampuh dan mudah digunakan untuk menyempurnakan dan menyesuaikan gambar apa pun, dengan peningkatan signifikan pada kemampuan inpainting untuk rekonstruksi bagian gambar yang hilang atau rusak.
Pengembangan dan penerapan Lyria, Veo 2, Chirp 3, dan Imagen 3 di Vertex AI memprioritaskan keamanan dan tanggung jawab dengan tindakan pencegahan bawaan seperti watermarking digital melalui SynthID, filter keamanan, dan tata kelola data. Pendekatan indemnifikasi industri-pertama Google juga memberikan ketenangan pikiran bagi pengguna terkait klaim IP pihak ketiga, termasuk hak cipta.
Cek Berita dan Artikel yang lain di Google News
dan follow Channel WhatsApp Medcom.id
(MMI)
Tidak ada komentar:
Posting Komentar