Dalam konteks teknologi pengenalan wajah dan pemodelan wajah 3D yang semakin banyak diterapkan di berbagai bidang seperti keamanan, layanan kesehatan , e-commerce, dan keamanan pribadi, kebutuhan untuk membangun basis data citra wajah yang terstruktur, beragam, dan berskala besar menjadi semakin mendesak. Salah satu tantangan utama saat ini adalah bagaimana mengumpulkan data citra dengan kualitas yang konsisten, dalam berbagai kondisi pencahayaan dan sudut pengambilan gambar, sekaligus memastikan akurasi dalam klasifikasi dan penyimpanan data.
Untuk mengatasi masalah ini, tim peneliti di Institut Sains dan Teknologi Vietnam - Korea (VKIST) telah mengembangkan perangkat lunak penangkap wajah VKIST, sebuah alat yang mendukung kontrol simultan terhadap sistem yang terdiri dari beberapa kamera digital dan modul pencahayaan, yang memungkinkan pengumpulan, pelabelan, dan penyimpanan data gambar wajah secara real time.
Solusi pengumpulan dan pemrosesan data citra wajah
Perekaman wajah VKIST diprogram dalam bahasa C#, menampilkan antarmuka yang ramah pengguna dalam bahasa Vietnam, mudah diintegrasikan dan diperluas.
Perekaman wajah VKIST memungkinkan kendali jarak jauh kamera DSLR Nikon dan Canon populer seperti 5DmarkII, 5DMarkIII, 6DMarkII, 1500D, 2000D, D60, D3000, D5100, D7100, D4, D800, dan sebagainya, melalui antarmuka USB dan protokol RS232. Pengguna dapat melakukan berbagai operasi seperti melihat gambar langsung (Live View), menyesuaikan parameter teknis (apertur, kecepatan rana, ISO), memerintahkan pengambilan foto secara bersamaan, dan mentransfer foto ke komputer secara real-time.
Khususnya, perangkat lunak ini mendukung kontrol simultan beberapa kamera—fitur penting dalam sistem pengumpulan data gambar multi-sudut. Antarmuka perangkat lunak dalam bahasa Vietnam dirancang dalam blok-blok fungsional terpisah untuk kemudahan penggunaan dan integrasi yang mudah ke dalam sistem yang kompleks.
Antarmuka perangkat lunak penangkap wajah VKIST (Gambar 1) dibagi menjadi beberapa blok terpisah dengan fungsi yang dijelaskan pada Gambar 2. Bahasa yang ditampilkan dalam perangkat lunak adalah bahasa Vietnam.
Antarmuka perangkat lunak penangkap wajah VKIST.
Diagram blok fungsional utama perangkat lunak.
Pengambilan wajah VKIST juga mengintegrasikan kemampuan untuk mengontrol intensitas cahaya sistem pencahayaan dengan mengirimkan data dari berkas konfigurasi ke sirkuit kontrol cahaya. Berkat hal ini, lingkungan pencahayaan selama proses pemotretan dikontrol secara presisi, memastikan kualitas gambar yang konsisten, yang merupakan faktor kunci dalam aplikasi AI.
Selain itu, fungsi kontrol intensitas cahaya juga terintegrasi ke dalam perangkat lunak ini. Pengguna hanya perlu memasukkan berkas parameter intensitas cahaya yang tersedia, kemudian menggunakan perangkat lunak untuk membaca data dan mengirimkan parameter tersebut ke sirkuit kontrol intensitas cahaya. Dari sana, kontrol intensitas cahaya di lingkungan sekitar secara akurat.
Keunggulan lainnya adalah kemampuan untuk memberi label data secara otomatis berdasarkan strukturnya, sehingga proses pengelolaan, pengambilan, dan pelatihan model AI menjadi lebih efisien. Perangkat lunak ini mendukung opsi mode penyimpanan data (lokal di kamera, disimpan di komputer) dan klasifikasi data berdasarkan skenario yang telah ditentukan sebelumnya.
Fitur unggulan lainnya adalah kemampuan untuk memberi label gambar secara otomatis berdasarkan struktur yang telah ditentukan, yang secara signifikan menghemat waktu klasifikasi manual. Pengambilan wajah VKIST memungkinkan konfigurasi cara penyimpanan gambar: Berdasarkan folder, objek, jenis ekspresi, atau variasi lain seperti memakai kacamata, memakai masker, mengubah gaya rambut...
Selain itu, perangkat lunak ini juga mendukung berbagai mode penyimpanan data, termasuk perekaman berurutan, penimpaan, atau penyimpanan di kamera sebelum ditransfer ke server. Hal ini membantu sistem lebih fleksibel dalam menangani gambar dalam jumlah besar, meminimalkan risiko kehilangan data atau kemacetan selama pengoperasian.
Platform penelitian kecerdasan buatan dan konstruksi basis data wajah skala besar
Perangkat lunak ini saat ini digunakan dalam sistem pengumpulan data citra wajah yang digunakan oleh VKIST, yang mencakup 33 kamera DSLR Canon, 20 modul pencahayaan yang dapat disesuaikan, rangka besi untuk menempatkan kamera dan pencahayaan di sekitar belahan bumi, serta tiga PC canggih dengan monitor dan perangkat lunak kontrol sistem. Dengan sistem ini, Laboratorium Gabungan/Departemen Teknologi Informasi VKIST-Nacentech telah mengumpulkan dan membangun basis data citra wajah sekitar 500 orang (sekitar 5 juta foto) dan terus mengumpulkan lebih banyak data.
Sampel data citra wajah multi-sudut dilakukan oleh perangkat lunak penangkap wajah VKIST.
Perangkat lunak ini telah digunakan dalam proyek kolaborasi dengan Institut Sains dan Teknologi Korea (KIST) untuk mengumpulkan data citra wajah lebih dari 1.000 orang Vietnam. Basis data ini mencakup sekitar 10 juta foto dengan beragam ekspresi wajah seperti normal, senang, sedih, takut, marah, terkejut, kesal, dan aksesori tersembunyi seperti topeng, kacamata, topi, dan wig dalam berbagai kondisi pencahayaan.
Antarmuka perangkat lunak dengan spesifikasi lengkap.
Data yang dikumpulkan dari sistem menggunakan perangkat lunak penangkap wajah VKIST telah dan sedang diterapkan dalam banyak arah penelitian dan pengembangan teknologi:
Pemodelan wajah 3D dari foto 2D multi-sudut,
Meningkatkan akurasi teknologi pengenalan wajah dalam kondisi cacat (pengaburan, pencahayaan kompleks),
Ukiran laser 3D wajah di kaca sebagai suvenir,
Merekonstruksi gambar wajah orang yang sudah meninggal dari foto-foto lama, melayani tujuan penyimpanan budaya dan warisan,
Aplikasi dalam e-commerce, estetika medis, augmented reality.
Pengembangan dan penerapan penangkapan wajah VKIST tidak hanya membantu VKIST mengambil inisiatif dalam membangun basis data besar tetapi juga berkontribusi untuk meningkatkan kapasitas penelitian di bidang visi komputer dan kecerdasan buatan di Vietnam - area inti dalam revolusi industri keempat.
Menguasai dan menguasai teknologi perangkat lunak untuk mengendalikan sistem perangkat keras khusus - terutama sistem optik multiperangkat - memainkan peran penting dalam membangun platform AI domestik yang sesuai dengan karakteristik antropometri orang Vietnam.
Penangkapan wajah VKIST merupakan demonstrasi pengembangan perangkat lunak berteknologi tinggi untuk penelitian dan penerapan sistem visi komputer di Vietnam. Penguasaan teknologi pengendalian dan sinkronisasi sistem pengumpulan data citra skala besar akan menjadi fondasi penting untuk membantu meningkatkan kapasitas pengembangan kecerdasan buatan di negara ini, terutama di bidang-bidang yang membutuhkan data antropometrik dengan karakteristik regional atau etnografi.
Departemen TI mendaftarkan hak cipta perangkat lunak "VKIST face capture" segera setelah menyelesaikan dan menguji seluruh program.
Sertifikat pendaftaran hak cipta untuk perangkat lunak penangkap wajah VKIST.
Sumber: https://mst.gov.vn/vkist-face-capture-phan-mem-thu-thap-du-lieu-anh-khuon-mat-da-goc-phuc-vu-nghien-cuu-va-phat-trien-ai-197250927011551324.htm
Komentar (0)