No contexto da tecnologia de reconhecimento facial e da modelagem facial 3D, cada vez mais aplicadas em diversas áreas, como segurança, saúde , comércio eletrônico e segurança pessoal, a necessidade de construir um banco de dados de imagens faciais estruturado, diversificado e em larga escala torna-se urgente. Um dos maiores desafios atuais é como coletar dados de imagem com qualidade consistente, sob diferentes condições de iluminação e em diversos ângulos de filmagem, garantindo a precisão na classificação e no armazenamento dos dados.
Para resolver esse problema, a equipe de pesquisa do Instituto de Ciência e Tecnologia Vietnã-Coreia (VKIST) desenvolveu o software de captura facial VKIST, uma ferramenta que oferece suporte ao controle simultâneo de um sistema composto por várias câmeras digitais e módulos de iluminação, permitindo a coleta, rotulagem e armazenamento de dados de imagens faciais em tempo real.
Solução de coleta e processamento de dados de imagem facial
A captura facial do VKIST é programada em linguagem C#, apresentando uma interface amigável em vietnamita, fácil de integrar e expandir.
A captura de rosto VKIST permite o controle remoto de câmeras DSLR populares da Nikon e Canon, como 5DmarkII, 5DMarkIII, 6DMarkII, 1500D, 2000D, D60, D3000, D5100, D7100, D4, D800..., via interface USB e protocolo RS232. Os usuários podem realizar operações como visualização de imagens ao vivo (Live View), ajuste de parâmetros técnicos (abertura, velocidade do obturador, ISO), comando de captura simultânea de fotos e transferência de fotos para o computador em tempo real.
Em particular, o software suporta o controle simultâneo de múltiplas câmeras — um recurso essencial em sistemas de coleta de dados de imagens multiangulares. A interface do software está em vietnamita e foi projetada em blocos funcionais separados para facilitar o uso e a integração em sistemas complexos.
A interface do software de captura facial VKIST (Figura 1) é dividida em blocos separados com funções descritas na Figura 2. O idioma exibido no software é o vietnamita.
Interface do software de captura de rosto VKIST.
Diagrama dos principais blocos funcionais do software.
A captura facial VKIST também integra a capacidade de controlar a intensidade da luz do sistema de iluminação, transmitindo dados de arquivos de configuração para o circuito de controle de luz. Graças a isso, o ambiente de iluminação durante o processo de captura é controlado com precisão, garantindo uma qualidade de imagem consistente, um fator-chave em aplicações de IA.
Além disso, a função de controle de intensidade luminosa também está integrada a este software. Os usuários precisam apenas inserir o arquivo de parâmetros de intensidade luminosa disponível, usar o software para ler os dados e transmitir os parâmetros para o circuito de controle de intensidade luminosa. A partir daí, é possível controlar com precisão a quantidade de luz no ambiente ao redor.
Outro destaque é a capacidade de rotular dados automaticamente de acordo com a estrutura, tornando o processo de gerenciamento, recuperação e treinamento de modelos de IA mais eficiente. O software suporta opções de modo de armazenamento de dados (localmente na câmera, salvo no computador) e classificação de dados de acordo com cenários predefinidos.
Outro recurso excepcional é a capacidade de rotular imagens automaticamente de acordo com uma estrutura pré-determinada, o que economiza significativamente o tempo de classificação manual. A captura de rosto do VKIST permite configurar como salvar imagens: por pasta, por objeto, por tipo de expressão ou outras variações, como usar óculos, usar máscaras, mudar o penteado...
Além disso, o software também suporta vários modos de salvamento de dados, incluindo gravação sequencial, sobregravação ou salvamento na câmera antes da transferência para o servidor. Isso permite que o sistema seja flexível no processamento de grandes quantidades de imagens, minimizando o risco de perda de dados ou gargalos durante a operação.
Plataforma de pesquisa de inteligência artificial e construção de banco de dados facial em larga escala
O software está sendo usado atualmente no sistema de coleta de dados de imagens faciais implantado pelo VKIST, que inclui 33 câmeras DSLR Canon, 20 módulos de iluminação ajustáveis, uma estrutura de ferro para posicionar câmeras e iluminação em um hemisfério e três PCs potentes com monitores e software de controle do sistema. Com este sistema, o Laboratório Conjunto VKIST-Nacentech/Departamento de Tecnologia da Informação, o VKIST, vem coletando e construindo um banco de dados de imagens faciais de cerca de 500 pessoas (cerca de 5 milhões de fotos) e continua coletando mais dados.
A amostra de dados de imagens faciais multiangulares foi realizada pelo software de captura facial VKIST.
O software foi utilizado em projetos colaborativos com o Instituto Coreano de Ciência e Tecnologia (KIST) para coletar dados de imagens faciais de mais de 1.000 vietnamitas. Este banco de dados inclui cerca de 10 milhões de fotos com diferentes expressões faciais, como normal, feliz, triste, assustado, irritado, surpreso, irritado e acessórios como máscaras, óculos, chapéus e perucas, sob diferentes condições de iluminação.
Interface de software com especificações completas.
Os dados coletados do sistema usando o software de captura facial VKIST foram e estão sendo aplicados em muitas direções de pesquisa e desenvolvimento de tecnologia:
Modelagem facial 3D a partir de fotos 2D multi-ângulo,
Aumentar a precisão da tecnologia de reconhecimento facial em condições deformadas (obscurecimento, iluminação complexa),
Gravação a laser 3D de rostos em vidro como lembranças,
Reconstruir imagens de rostos de pessoas falecidas a partir de fotos antigas, servindo a propósitos de armazenamento cultural e patrimonial,
Aplicações em comércio eletrônico, estética médica, realidade aumentada.
O desenvolvimento e a aplicação da captura facial do VKIST não apenas ajudam o VKIST a tomar a iniciativa de construir grandes bancos de dados, mas também contribuem para melhorar a capacidade de pesquisa em visão computacional e inteligência artificial no Vietnã — áreas centrais da quarta revolução industrial.
Dominar e dominar a tecnologia de software para controlar sistemas de hardware especializados - especialmente sistemas ópticos multidispositivos - desempenha um papel importante na construção de plataformas de IA domésticas adequadas às características antropométricas do povo vietnamita.
A captura facial do VKIST é uma demonstração do desenvolvimento de ferramentas de software de alta tecnologia para pesquisa e implantação de sistemas de visão computacional no Vietnã. Dominar a tecnologia de controle e sincronização de sistemas de coleta de dados de imagem em larga escala será uma base importante para ajudar a promover a capacidade de desenvolvimento da inteligência artificial no país, especialmente em áreas que exigem dados antropométricos com características regionais ou etnográficas.
O departamento de TI registrou os direitos autorais do software "VKIST face capture" imediatamente após concluir e testar todo o programa.
Certificado de registro de direitos autorais para o software de captura facial VKIST.
Fonte: https://mst.gov.vn/vkist-face-capture-phan-mem-thu-thap-du-lieu-anh-khuon-mat-da-goc-phuc-vu-nghien-cuu-va-phat-trien-ai-197250927011551324.htm
Comentário (0)