Computer vision (CV) adalah suatu transformasi data dari suatu citra berupa gambar atau video menjadi suatu keputusan atau representasi baru yang berbeda. Transformasi dilakukan untuk mendapatkan tujuan tertentu. Sebagai contoh, diberikan masukan citra manusia yang tertangkap oleh kamera yang dipasang di mobil. Keputusan yang dihasilkan oleh CV bisa seperti “terdapat 3 orang di scene ini”. Representasi baru yang dihasilkan oleh CV bisa seperti mengubah citra wana menjadi citra grayscale (Bradski dan Kaehler, 2008).

Berbeda dengan mata manusia yang menangkap data setiap objek secara visual dan dapat mengetahui bentuk dan jarak suatu objek dengan mudah, komputer menangkap tiap data yang masuk berupa susunan angka dalam matriks dua dimensi yang mewakili warna dari data visual yang masuk (Ruslianto dkk., 2015).

Tujuan dilakukannya computer vision antara lain (Rodriguez Fernandez, 2014):

  • deteksi, segmentasi dan lokalisasi objek (contoh: identifikasi wajah);
  • object tracking (contoh: mengikuti pergerakan pejalan kaki untuk keperluan
    penjagaan);
  • pencarian gambar berdasarkan konten (contoh: pencarian gambar online);
  • restorasi citra (contoh: penghapusan motion blur atau noise);
  • konstruksi 3D dari kumpulan citra 2D.