-
Tugas 1.1
Untuk mencapai hasil dari sebuah misi kita terlebih dahulu harus menentukan tugas-tugas apa yang perlu dilakukan. Misi 1 kita adalah untuk memudahkan masyarakat umum dalam mempelajari dokumen-dokumen kasus hukum yang terlihat di persidangan sebagai tumpukan kertas yang sangat banyak. Tujuannya adalah supaya masyarakat tidak membuat pernyataan-pernyataan yang bertentangan dengan fakta-fakta persidangan. Sebagai warga negara yang…
-
Vektor
Teknik yang saya gunakan pada tulisan sebelumnya adalah sebagai berikut:1. Pecah isi dokumen menjadi beberapa bagian.2. Setiap bagian dirubah menjadi vektor lalu masukkan ke dalam basis data.3. Pertanyaan masukan dalam bentuk vektor digunakan untuk mencari bagian dokumen yang paling mirip. Teori dasar dari teknik ini adalah jarak pitagoras. Sistem basis data bertugas mencari vektor isi…
-
Misi 1
Dua tahun belakangan ini ada beberapa kasus hukum yang menarik perhatian masyarakat karena kisahnya diangkat ke layar kaca: kopi sianida dan pembunuhan vina. Kasus tersebut terjadi beberapa tahun yang lalu dan telah menghasilkan putusan hukum yang mengikat. Masing-masing terdakwa pun sedang menjalani hukuman di penjara. Yang menarik perhatian saya adalah tumpukan berkas perkara setiap kali…
-
Aksa
Kenapa nama blog ini ‘aksa’? Begini ceritanya. Dari dulu saya punya impian untuk memiliki perusahaan sendiri. Saya banyak membaca buku tentang para pendiri perusahaan teknologi seperti Bill Gates, Steve Jobs, Jeff Bezos dan Elon Musk. Saya juga membaca buku tentang Starbucks. Mereka semua punya kesamaaan : memiliki visi tentang sesuatu yang akan terjadi di masa…
-
Konteks
Sekarang kita coba rubah sedikit paragrafnya menjadi: Budi tinggal dekat pasar. Di pasar bertemu Andi. Berarti Andi juga tinggal dekat pasar. Kesimpulan ini belum tentu benar karena bisa saja rumah Andi lebih jauh dari pasar. Dan orang pergi ke pasar untuk membeli atau menjual sesuatu barang walaupun rumahnya jauh. Jadi, cara menyusun sebuah kesimpulan dari beberapa…
-
Matriks
Mari kita lihat sebuah paragraf sederhana berikut ini: Budi pergi ke pasar. Di pasar bertemu Andi. Berarti Andi juga pergi ke pasar. Apakah kita bisa menulis program komputer untuk membuat kesimpulan seperti kalimat di atas yang dicetak tebal? Langkah awal kita tentukan dulu variabel dan konstanta pada paragraf di atas. X pergi ke Y. Di…
-
Token
Bagaimana cara merubah teks dari sesuatu yang manusia pahami, menjadi sesuatu yang bisa dipahami oleh mesin? Metode yang umum digunakan adalah BPE. Contoh sederhana: Contoh diatas menggunakan karakter sebagai sebuah token. Mari kita gunakan data masukan berupa kumpulan kata yang benar dalam bahasa inggris: “up up you go then you go down down “. Jika…
-
Data
Bagaimana mungkin sebuah program komputer bisa menghasilkan sendiri sebuah kalimat baru yang cukup punya makna? Seolah-olah ia belajar dengan sangat baik sekali dari data yang diberikan. Proses panjang yang pada awalnya tentu dimulai dari pembentukan teks menjadi sesuatu yang bisa dimengerti oleh mesin yaitu bytes. Teks data yang digunakan oleh llm.c dapat dilihat di sini.…
-
GenAI
Akhirnya saya menemukan VPS dengan GPU yang bisa disewa per jam untuk menjalankan llm.c. Setelah melakukan konfigurasi yang dibutuhkan, codebase siap untuk dicoba. Dengan memory GPU sebesar 8GB, eksekusi program training berhasil dijalankan. Ngepas sekali ternyata jumlah alokasi memory llm.c dengan spesifikasi GPU. Sekarang mari kita lihat contol hasil text generation dibandingkan dengan data masukan.…
-
llm.c
Pikiran tentang kecerdasan buatan semakin melekat di kepala saya setelah melihat ini. Sebuah codebase LLM yang merupakan algortima inti aplikasi AI seperti chatGPT. Karena saya sangat menyukai bahasa pemrograman c dan senang membaca dalam bytes. 9 tahun yang lalu saya pernah iseng membuat sendiri implementasi protokol telekomunikasi dalam bahasa pemrograman c d sini. Kemudian saya…