AI dan manusia berbenturan dalam eksperimen kreativitas terbesar di dunia.
AI telah melewati tolok ukur baru, mencetak skor lebih baik daripada rata-rata manusia dalam tes kreativitas yang diakui yang melibatkan 100.000 orang. Tetapi ada lebih banyak hal di balik hasil tersebut, yang menunjukkan betapa sulitnya untuk menempatkan “kreativitas” dalam kotak yang terukur.
Para peneliti dari Université de Montréal memimpin sebuah studi skala besar yang membandingkan 100.000 manusia dengan model AI generatif terkemuka saat ini dalam upaya untuk menilai kekuatan kreatif keduanya. Ini adalah studi perbandingan terbesar dari jenisnya yang pernah dilakukan.
Untuk mengukur apa yang sebagian besar dari kita anggap sebagai bidang subjektif, tim menggunakan tugas kreativitas linguistik yang berbeda untuk menilai LLM terbaru termasuk ChatGPT, Claude, dan Gemini, serta manusia.
“Kami mengembangkan kerangka kerja yang ketat yang memungkinkan kami membandingkan kreativitas manusia dan AI menggunakan alat yang sama, berdasarkan data dari lebih dari 100.000 peserta,” kata Profesor Karim Jerbi, dari Departemen Psikologi di Université de Montréal.
Pertama-tama, perlu disampaikan: Jelas sangat sulit untuk mengukur kreativitas manusia dengan cara yang dapat dibandingkan dengan gelar LLM. Jadi, meskipun ini adalah studi besar, studi ini tetap dibatasi oleh ukuran dan batasan yang digunakan oleh para ilmuwan.
Tim tersebut menggunakan Divergent Association Task (DAT), sesuatu yang digunakan dalam psikologi untuk mengukur jenis kreativitas tertentu. Pada dasarnya, tugas ini meminta seseorang untuk menyebutkan 10 kata dalam empat menit , dan semakin sedikit keterkaitan antar kata, semakin kreatif daftar tersebut dianggap. Kemudian para ilmuwan meminta model AI untuk melakukan hal yang sama.
Yang mereka temukan adalah bahwa meskipun LLM menunjukkan kreativitas yang lebih tinggi – sebagaimana diukur oleh DAT – daripada sejumlah besar manusia, sekitar setengah dari peserta berkinerja lebih baik daripada AI, dan 10% teratas jauh melampaui kinerja penantang komputer mereka.
Jadi ya, meskipun beberapa orang gagal menunjukkan “kreativitas divergen” yang lebih besar daripada Claude, misalnya, banyak sekali orang yang mampu melakukannya. Dan ini menyoroti betapa sulitnya bagi mesin-mesin tercanggih sekalipun saat ini untuk meniru hasil kerja otak manusia – bahkan setelah para penciptanya telah mengumpulkan hampir setiap kata dalam setiap bahasa di Bumi.
“Meskipun AI sekarang dapat mencapai tingkat kreativitas manusia pada tes tertentu, kita perlu melampaui persepsi persaingan yang menyesatkan ini,” kata Jerbi. “ AI generatif di atas segalanya telah menjadi alat yang sangat ampuh untuk melayani kreativitas manusia: AI ini tidak akan menggantikan para pencipta, tetapi akan secara mendalam mengubah cara mereka membayangkan, mengeksplorasi, dan menciptakan – bagi mereka yang memilih untuk menggunakannya.”
Jadi, meskipun LLM (Learning Learning Models) lebih baik daripada sebagian manusia dalam hal tugas-tugas kreatif tertentu, hal yang sama dapat dikatakan ketika menilai sekelompok orang. Dan studi ini menyoroti betapa kompleks dan bernuansanya pengukuran sifat-sifat manusia – dan bagaimana skor tolok ukur LLM sebenarnya bukanlah indikator yang solid untuk digunakan dalam analisis komparatif.
“Meskipun AI sekarang dapat mencapai tingkat kreativitas manusia dalam pengujian tertentu, kita perlu melampaui persepsi persaingan yang menyesatkan ini,” kata Jerbi. “AI generatif di atas segalanya telah menjadi alat yang sangat ampuh untuk melayani kreativitas manusia: AI ini tidak akan menggantikan para pencipta, tetapi akan secara mendalam mengubah cara mereka membayangkan, mengeksplorasi, dan menciptakan – bagi mereka yang memilih untuk menggunakannya.”
Para peneliti juga menyelidiki bagaimana model AI dibandingkan dengan manusia dalam hal tugas menulis kreatif, termasuk haiku, sinopsis film, dan cerita pendek. Sekali lagi, manusia yang paling kreatif mengungguli mesin – meskipun secara keseluruhan LLM (Learning Learning Models) mencetak skor lebih baik daripada peserta rata-rata.
Dan perlu dicatat bahwa para LLM (Licensed Learning Managers) menunjukkan kreativitas paling besar ketika mereka dibimbing dengan baik – oleh manusia. Jadi tampaknya kita masih jauh dari kemungkinan digantikan. Dan sementara AI telah merambah kehidupan sehari-hari kita, ada penolakan yang semakin meningkat terhadap penggunaan AI yang buruk dan teknologi yang mengeksploitasi seniman. Baru-baru ini, sekitar 800 seniman telah bersatu untuk berkampanye menentang penggunaan konten yang dihasilkan AI di berbagai bidang kreatif.