Uji Performa LLM dengan Ollama Benchmark
Ollama Benchmark adalah ekstensi Chrome yang dirancang untuk membandingkan kinerja model bahasa besar (LLM) secara lokal. Dengan alat ini, pengguna dapat melakukan pengujian terhadap berbagai model seperti Mistral, LLaMA, dan Qwen, serta mendapatkan hasil yang terperinci. Fitur unggulan termasuk kemampuan untuk memilih beberapa model untuk diuji secara bersamaan dan melakukan pengujian berbasis prompt. Hasil pengujian dapat diekspor dalam format .txt, .csv, atau .json, memudahkan analisis lebih lanjut.
Selain itu, Ollama Benchmark mendukung penyimpanan lokal untuk pengaturan dan hasil, sehingga pengguna dapat dengan mudah mengakses data sebelumnya. Alat ini juga dapat berfungsi dengan API Ollama baik yang lokal maupun remote, dan menawarkan antarmuka multibahasa dalam Bahasa Inggris dan Turki. Dengan tidak ada pengumpulan data dan sepenuhnya gratis, Ollama Benchmark menjadi pilihan ideal bagi pengembang dan peneliti yang ingin mengoptimalkan alur kerja AI mereka.