Penggunaan metode penilaian esai otomatisasi saat ini mendukung perkembangan pembelajaran melalui integrasi komputasi selain dengan menggunakan human rater. Penilaian yang bersifat formatif ini diyakini secara efektif mampu memberikan cukup bukti untuk menutup kesenjangan empiris penilaian manusia dalam inkonsistensi dan penyimpangan sebagai penilai. Kami beragumen bahwa metode penilaian otomatisasi memberikan satu alternatif solusi dalam menjawab kekurangan penskoran manusia. Meskipun pada pengembangannya masih membutuhkan uji keefektifan terhadap apa yang menjadi kelebihan penilaian otomatisasi. Maka penelitian ini mengambil latar perkembangan penilaian esai otomatis dengan meracancang dan mengembangkan sistem Automated Essay Scoring (AES) untuk diterapkan pada penilaian uji kompetensi IT Multimedia Desain Grafis di pendidikan vokasi jenjang diploma 1 dan 2 Akademi Komunitas Pacitan dan Blitar.
Untuk membuktikan efektiftas sistem AES yang dikembangkan, kami membutuhkan identifikasi kebutuhan perancangan dan pengembangan prototype sistem dengan menggunakan tahapan metode penelitian research and development. Tahapan ini mencakup preliminary investigation, design, realization/ contruction, test, evaluation, and revision, dan implementation. Dengan tujuan penelitian adalah (1) merancang dan mengembangkan sistem AES untuk dapat digunakan secara efektif dalam penilaian uji kompetensi, (2) mengukur dan menganalisis tingkat validitas instrumen indikator variabel, (3) mengukur dan menganalisis tingkat reliabilitas antara sistem AES dengan human rater, dan (4) menganalisis perbedaan nilai akurasi antara sistem AES dengan human rater. Maka bukti validasi dikumpulkan menggunakan data sampel sebanyak 38 responden untuk mendukung dan memenuhi prosedur serta mekanisme pengembangan dan pengujian penilaian otomatis dengan menggunakan pendekatan machine learning, dan metode deep learning. Hasil penggunaan data sampel merupakan pengambilan dari populasi penelitian sebanyak 42 responden dengan menggunakan penghitungan rumus Slovin.
Hasil penelitian research and development ini menunjukkan bahwa, (1) rancangan sistem AES dengan menggunakan pendekatan algoritma cosine similarity menghasilkan kinerja sistem dapat berjalan efektif, (2) penghitungan validitas instrumen indikator variabel menunjukkan rentang hasil interval skor diantara 81.67% s/d 83.3%, dan masuk kategori layak, (3) dengan menggunakan konversi rentang score similarity menjadi score test uraian dihasilkan nilai reliabilitas sistem AES sebesar 0.980, sementara human rater berada 0.974, (4) berdasarkan hasil penghitungan text regression dan dengan mempertimbangan rumusan rubrik penilaian, konversi nilai akurasi skor prediksi dan aktual antara sistem AES dan human rater pada pengujian menunjukkan hasil rerata sebesar 77.5% AES dan antara ≤ 0.60 ˂ 0.80 human rater atau skor masuk kedalam skala 4. Berdasarkan hasil penelitian, sistem AES telah terbukti secara efektif untuk dapat diterapkan pada pengujian uji kompetensi metode esai bidang IT Multimedia Desain Grafis di Akademi Komunitas Pacitan dan Blitar. Dengan demikian Automated Essay Scoring (AES) yang dikembangkan sebagai alternatif-formatif perangkat komputasi untuk mengukur penilaian esai kompetensi substansil-kognitif, dan melalui pengembangan sistem AES pada penerapan penilaian jawaban esai uji kompetensi di locus penelitian telah mendukung perkembangan pembelajaran media komputasi dengan pendekatan teori machine learning.