Jumat, Desember 5, 2025
BerandaUncategorizedGPT-5 vs Gemini 2.5 Flash: Karya Lukis Jakarta yang Lebih Realistis?

GPT-5 vs Gemini 2.5 Flash: Karya Lukis Jakarta yang Lebih Realistis?

Penggunaan Kecerdasan Buatan dalam Menghasilkan Gambar yang Realistis

Teknologi kecerdasan buatan (AI) kini tidak hanya digunakan untuk menjawab pertanyaan berbasis teks, tetapi juga bisa menghasilkan gambar dengan kualitas yang cukup realistis. Dengan satu kalimat singkat, chatbot bisa “melukis” visual sesuai permintaan pengguna. Dalam hitungan detik, gambar apa pun bisa direkayasa oleh sistem AI tersebut.

Kemampuan AI ini semakin banyak dikembangkan lewat berbagai pembaruan besar. OpenAI baru saja meluncurkan GPT-5 untuk ChatGPT yang digadang-gadang lebih canggih dan akurat. Sementara itu, Google juga menghadirkan Gemini 2.5 Flash yang diklaim punya kemampuan visual lebih canggih, termasuk kualitas gambar yang lebih baik, kontrol kreatif yang lebih presisi, hingga kecepatan pemrosesan yang tetap rendah.

Untuk membuktikan kemampuan keduanya, kami melakukan eksperimen dengan memintanya membuat gambar dan membandingkan mana yang paling mendekati kata “realistis”. Kami memberikan lima prompt yang sama kepada ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan kota Jakarta dalam berbagai tempat dan situasi. Berikut lima topik prompt yang dipakai:

  • Kota Jakarta saat jam sibuk di pagi hari
  • Suasana malam hari di sekitar kawasan Bundaran HI
  • Kota tua Jakarta dan ragam aktivitasnya
  • Stadion GBK
  • Jakarta di masa depan

Aspek detail dan kesesuaian dengan deskripsi prompt menjadi kriteria penilaian untuk menilai kedua AI ini.

Hasil Gambar ChatGPT-5 dan Gemini 2.5 Flash

1. Menggambar Jakarta di Jam Sibuk Pagi Hari

Pada prompt pertama, kami meminta AI ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan Kota Jakarta saat di jam sibuk pagi hari. Secara keseluruhan, kedua chatbot ini sama-sama mampu menghasilkan gambar sesuai dengan prompt yang kami beri. Namun ada perbedaan visual yang signifikan, khususnya dari segi tone warna dan gaya visual gambar.

ChatGPT-5 menghasilkan gambar dengan tone warna kuning keemasan yang membuat suasana terasa hangat dan dramatis. Elemen gambarnya cukup sesuai dengan prompt, seperti jalanan penuh deretan mobil, ojek online yang sedang melintas, bus TransJakarta berwarna biru, tugu Monas, dan pejalan kaki. Namun, efek pencahayaan yang terlalu terang membuat suasana Jakarta justru terasa seperti sore hari alih-alih pagi hari. Selain itu, komposisi posisinya masih kurang akurat, terutama pada letak Tugu Monas yang digambarkan terlalu dekat dengan jalan raya.

Sementara itu, Gemini 2.5 Flash menampilkan visual dengan tone warna yang lebih natural dan cerah. Langit terlihat biru pucat khas pagi hari, pepohonan sekitar Monas juga tampak lebih hijau. Elemen lain seperti variasi aktivitas di jalan dibuat lebih kreatif dengan menambah kedalaman suasana. Dari sisi detail dan storytelling visual, AI Gemini jauh lebih bisa menggambarkan kota “Jakarta” dibanding GPT-5.

2. Suasana Malam Hari di Sekitar Kawasan Bundaran HI

Pada prompt kedua, kami meminta ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan suasana malam di kawasan Bundaran HI Jakarta yang lengkap dengan air mancur, lalu lintas padat, serta gedung-gedung ikonik di sekitarnya. Secara umum, terlihat perbedaan yang cukup mencolok antara Gemini 2.5 Flash dan ChatGPT-5, terutama pada keberadaan tugu di Bundaran HI.

ChatGPT-5 menghasilkan gambar visual dengan tone warna yang lebih gelap. Air mancurnya divisualisasikan secara proporsional, tidak terlalu tinggi, dan tugu selamat datang tampil jelas di tengah bundaran. Pencahayaan jalan, pantulan lampu kota, dan komposisi gedung di sekitar area juga terasa lebih akurat. Meskipun, letak kendaraan yang dijejer berjarak justru memberi kesan “kaku”, karena kurang bisa menangkap padatnya lalu lintas khas Jakarta pada malam hari.

Sementara itu, Gemini 2.5 Flash menampilkan Bundaran HI dengan kesan yang lebih cerah, dinamis, dan penuh warna. Namun, ada satu detail penting yang hilang: tugu atau patung selamat datang di tengah bundaran hilang dan tidak divisualisasikan secara akurat. Tugu tersebut justru diganti dengan air mancur yang didominasi gradasi warna pelangi. Meskipun saturasi dan pencahayaan yang dihasilkan Gemini membuat gambar terlihat lebih “hidup”, kesan realistisnya jadi berkurang karena detail tata letak tidak sesuai kenyataan.

3. Kota Tua Jakarta dan Ragam Aktivitasnya

Untuk prompt ketiga, kami meminta ChatGPT-5 dan Gemini 2.5 Flash menggambarkan suasana Kota Tua Jakarta yang dipenuhi berbagai aktivitas khas, mulai dari pedagang kaki lima, ondel-ondel, penyewa sepeda, hingga pengunjung yang sedang berfoto. ChatGPT-5 berhasil menghadirkan atmosfer Kota Tua yang cukup “hidup”. Elemen khas seperti pedagang kerak telor, es podeng, dan ondel-ondel tampil jelas, lengkap dengan detail gerobak dan nama dagangannya.

Namun, beberapa bagian terasa “terlalu rapi”, terutama posisi pedagang kaki lima yang tampak agak dipaksakan berjajar rapi. Wajah pengunjung juga terasa “aneh” karena strukturnya tidak beraturan. Ada yang tidak memiliki mata, ukuran hidungnya terlalu besar, dan proporsi wajahnya tidak seimbang. Kekurangan ini membuat hasil visual AI ChatGPT-5 kurang mulus dan tidak realistis.

Sementara itu, Gemini 2.5 Flash mampu menampilkan hasil yang lebih baik. Elemennya lebih beragam, aktivitas pengunjung juga tampak lebih natural, mulai dari orang-orang yang duduk santai hingga anak-anak yang bermain di sekitar area sepeda warna-warni. Pencahayaan yang digunakan memberikan kesan cerah dan segar, sesuai dengan suasana siang hari. Detail elemen seperti bangunan tua, pepohonan, dan gerobak dagangan juga divisualisasikan dengan cukup rapi, memberikan kesan realistis tanpa mengorbankan sisi artistik.

4. Stadion GBK dan Aktivitasnya

Pada prompt keempat, kami meminta kedua model menggambarkan suasana olahraga warga di kawasan Stadion Utama Gelora Bung Karno pada malam hari. Secara umum, GPT-5 dan Gemini 2.5 Flash mampu menyajikan keramaian khas GBK, lengkap dengan pengunjung yang sedang berolahraga malam. Namun, lagi-lagi, ada perbedaan menarik pada hasil visual keduanya.

ChatGPT cenderung menghasilkan gambar yang rapi tapi terasa agak “kaku”. Para pelari dan orang-orang yang sedang berolahraga ditata hampir simetris, seolah diatur dalam satu barisan. Ekspresi wajahnya pun cenderung seragam, sehingga kesan naturalnya sedikit hilang. Pada aspek pencahayaan, warna yang ditampilkan GPT-5 punya tone hangat, efek malam harinya jadi kurang terasa karena atmosfernya hampir mendekati golden hour ketimbang cahaya lampu sorot stadion yang dramatis.

Sebaliknya, Gemini 2.5 Flash memilih komposisi yang menampilkan variasi aktivitas yang lebih beragam. Ada yang jogging, yoga, membeli makanan di gerobak kaki lima, hingga duduk santai sambil berbincang. Efek pancaran lampu stadion dengan warna kebiruan memberikan kesan malam hari yang lebih “realistis”. Hasilnya juga terasa immersive, seolah benar-benar berada di tengah keramaian GBK pada malam hari.

5. Jakarta di Masa Depan

Pada prompt terakhir, kami meminta kedua chatbot untuk menggambarkan kota Jakarta di masa depan. Secara keseluruhan, hasil visual Gemini 2.5 Flash dan ChatGPT-5 mampu menginterpretasikan kesan futuristik yang sama-sama menarik. Hanya saja, keduanya membawa desain yang berbeda.

ChatGPT-5 lebih mengambil ke perspektif berbeda dengan menonjolkan nuansa cyberpunk. Palet warna neon biru dan magenta yang lebih pekat membuat atmosfer Jakarta terasa dingin, sendu, dan misterius. Gedung-gedungnya tampil futuristik, simetris dan megah. GPT-5 menggambarkan jalanan Jakarta di masa depan tampak ramai dengan banyak kendaraan dan manusia yang sedang berjalan. Di beberapa gedung, tulisan dengan cahaya lampu terlihat mencolok menambah kesan dramatis pada gambar. ChatGPT-5 juga seolah-olah ingin menampilkan Jakarta di masa depan yang penuh dengan teknologi canggih namun bernuansa gelap.

Sementara itu, Gemini memotret Jakarta dengan elemen gedung-gedung yang didesain variatif. Ada jalur skytrain yang melayang, mobil dengan visual teknologi yang canggih, hologram iklan besar, hingga detail tugu monas yang tampak proporsional. Suasananya terasa hidup berkat kehadiran kendaraan otonom, drone, hingga hologram iklan berwarna cerah yang memenuhi udara, menghadirkan kesan kota yang modern, rapi, dan penuh kehidupan.

Kesimpulan

Dari lima prompt yang kami beri, kesimpulan yang bisa diambil adalah kedua chatbot ini masih memiliki kelebihan dan kekurangan masing-masing. Gemini 2.5 Flash unggul dalam konsistensi visual dan proporsi detail. Hasil gambarnya mendekati kata “realistis”, terlihat dari bentuk wajah, pencahayaan, hingga komponen lain di dalam gambar.

Sementara itu, ChatGPT-5 lebih eksploratif dan artistik. Pilihan warnanya berani, permainan cahaya, hingga sentuhan sinematik banyak diperlihatkan, membuat visualnya tampak lebih dramatis dan berkarakter. Meskipun, di beberapa gambar, elemen wajah manusia yang ditampilkan GPT-5 sangat tidak proporsional, memberikan efek yang aneh dan tidak realistis.

Menurut kami, Gemini 2.5 Flash akan sangat cocok bagi pengguna yang membutuhkan gambar dengan konsep realistis dan tidak terlalu berlebihan. Sedangkan, jika pengguna lebih suka mengeksplor tampilan dengan nuansa yang berbeda, bisa mencoba AI ChatGPT-5. Sebab, gambar yang dihasilkan AI ini cenderung tampil sinematik dengan pilihan warna yang berani.

zonagadget
zonagadgethttps://www.zonagadget.co.id/
Berikan ilmu yang kamu punya, niscaya kamu akan mendapatkan yang lebih
RELATED ARTICLES

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

New Post

Most Popular