Tren Foto Ajaib yang Menggemparkan Media Sosial
Beberapa waktu terakhir, tren foto ajaib seperti berpose dengan idol K-Pop, berfoto bersama orang tua yang sudah wafat, hingga membuat potret diri versi kecil atau hasil ala studio sempat menjadi sorotan di media sosial. Tren ini tidak hanya menarik perhatian pengguna, tetapi juga menghadirkan berbagai inovasi teknologi yang mampu menciptakan gambar dengan kualitas tinggi.
Di balik semua itu, ada satu model AI yang sedang menjadi favorit banyak orang, yaitu Gemini 2.5 Flash Image atau dikenal dengan nama Nano Banana. Model kecerdasan buatan dari Google ini khusus dirancang untuk menghasilkan dan mengedit gambar dengan akurasi tinggi.
Peningkatan Teknologi Gemini Nano Banana
Google kini telah memperbaiki teknologi ini dengan dukungan 10 rasio gambar berbeda. Mulai dari sinematik lebar (21:9), standar layar (16:9, 4:3, 3:2), kotak (1:1), hingga potret untuk media sosial (9:16, 3:4, 2:3). Ada juga format fleksibel 5:4 dan 4:5. Dengan peningkatan ini, pengguna kini bisa lebih mudah menyesuaikan hasil gambar sesuai kebutuhan mereka.
Sebelumnya, pengguna hanya bisa membuat gambar dalam format terbatas, bahkan sering kali rasio gambarnya tidak sesuai dengan harapan. Namun, sekarang Gemini Nano Banana mampu menghasilkan visual dalam 10 pilihan rasio yang beragam.
Keunggulan dan Kemampuan Gemini Nano Banana
Dengan kemampuan ini, baik kreator konten, desainer, maupun pengguna awam dapat langsung menyesuaikan hasil gambar sesuai kebutuhan. Misalnya, untuk membuat poster bioskop, unggahan Instagram Story/feed, hingga wallpaper ponsel, semuanya bisa lebih pas tanpa harus repot memotong atau mengedit gambar lagi.
Selain itu, keunggulan Nano Banana bukan hanya soal rasio gambar, tetapi juga kemampuannya menjaga konsistensi karakter. Google menyebutkan bahwa kemampuan ini sulit dicapai oleh model lain. Contohnya, jika pengguna membuat rangkaian foto dengan wajah sama, Nano Banana bisa memastikan ekspresi, gaya, dan detailnya tetap konsisten dari satu gambar ke gambar lain.
Fitur Utama Gemini Nano Banana:
- Konsistensi Karakter: Bisa menempatkan karakter atau objek yang sama ke berbagai latar berbeda tanpa mengubah penampilan aslinya.
- Edit Berbasis Perintah Teks: Pengguna cukup mengetik instruksi sederhana untuk mengedit gambar.
- Multi-Image Fusion: Menggabungkan beberapa foto ke dalam satu hasil.
- Pengetahuan Dunia Nyata: Model ini diklaim memahami konteks visual dan informasi dunia, sehingga bisa digunakan untuk hal-hal edukatif.
- Kualitas Visual: Hasil gambar disebut lebih natural dan tajam hingga 1.024 piksel.
Aplikasi dan Penggunaan Praktis
Banyak pengembang mulai memanfaatkan Nano Banana untuk aplikasi kreatif. Startup Cartwheel berhasil membuat sistem pengendalian pose 3D dengan Nano Banana, memungkinkan seniman menghasilkan karya dengan kontrol karakter yang lebih nyata. Sementara itu, studio gim Volley menggunakan model ini untuk membuat visual dinamis dalam gim dungeon crawler mereka.
Akses dan Biaya Layanan
Gemini Nano Banana bisa diakses secara gratis melalui web/aplikasi Google Gemini. Untuk perusahaan, Gemini 2.5 Flash Image bisa diakses melalui Gemini API di Google AI Studio maupun Vertex AI. Google juga menyediakan contoh aplikasi siap pakai seperti:
- Bananimate: mengubah gambar jadi GIF animasi,
- Enhance: memperbesar foto dengan detail tanpa pecah,
- Fit Check: ruang ganti virtual untuk mencoba pakaian.
Dari segi harga, layanan ini dibanderol sekitar 30 dollar AS (sekitar Rp 370.000) per 1 juta output token. Satu gambar (resolusi hingga 1.024 x 1.024 piksel) dihitung setara 1.290 token, sehingga biaya per gambar sekitar 0,039 dollar AS (sekitar Rp 650).
Token itu merupakan satuan teks yang dibaca AI untuk menghasilkan instruksi atau deskripsi gambar. Jadi, jika kita membuat banyak output berbasis teks (misalnya editan rumit atau instruksi panjang), biayanya dihitung dengan sistem token.

