Ketika kita menambahkan "tolong" atau "terima kasih" pada prompt, kita sebenarnya menambah jumlah token yang harus diproses oleh model. Misalnya, alih-alih "Buatkan ringkasan artikel ini", kita menulis "Tolong buatkan ringkasan artikel ini. Terima kasih." Tambahan "Tolong" dan "Terima kasih" bisa menambah sekitar 2-4 token pada input.
Meskipun dalam satu interaksi, tambahan token ini terlihat sepele, dampaknya bisa menjadi signifikan ketika dikalikan dengan miliaran interaksi yang terjadi setiap hari di seluruh dunia. OpenAI dan penyedia LLM lainnya memproses triliunan token setiap bulan. Bahkan peningkatan kecil dalam jumlah token per prompt dapat berarti peningkatan biaya operasional yang substansial dalam skala agregat.
Setiap token yang diproses oleh LLM membutuhkan daya komputasi dari server dan chip khusus (GPU) yang sangat mahal. Ini juga mengkonsumsi energi listrik yang besar. Jadi, secara teknis, semakin banyak token yang diproses (baik dari input maupun output), semakin besar biaya yang ditanggung OpenAI. Dari perspektif murni efisiensi teknis dan finansial, prompt yang ringkas dan langsung memang lebih "murah" untuk diproses.
Antara Efisiensi dan Interaksi Manusiawi
Namun, penting juga untuk melihat hal ini dari sudut pandang yang berbeda. Apakah OpenAI benar-benar "rugi" karena kebiasaan sopan ini? Mungkin tidak sesederhana itu.
Kualitas Output: Ada argumen bahwa menambahkan kata-kata sopan atau memberikan prompt yang lebih ramah justru dapat menghasilkan output yang lebih baik dari LLM. Beberapa penelitian menunjukkan bahwa prompt yang lebih kontekstual atau "berbicara" dapat membantu model memahami niat pengguna dengan lebih baik dan menghasilkan respons yang lebih relevan dan bernuansa. Jika kualitas output meningkat, nilai yang dirasakan pengguna juga meningkat, yang pada akhirnya dapat mendorong lebih banyak penggunaan dan loyalitas terhadap platform.