A mobile device framework for video captioning using multimodal neural networks (2023)
- Authors:
- USP affiliated authors: CESAR JUNIOR, ROBERTO MARCONDES - IME ; DAMACENO, RAFAEL JEFERSON PEZZUTO - IME
- Unidade: IME
- DOI: 10.5753/sibgrapi.est.2023.27457
- Assunto: VISÃO COMPUTACIONAL
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Publisher: SBC
- Publisher place: Porto Alegre
- Date published: 2023
- Source:
- Título: Anais estendidos
- Conference titles: Conference on Graphics, Patterns and Images - SIBGRAPI
- Este periódico é de assinatura
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: bronze
-
ABNT
DAMACENO, Rafael Jeferson Pezzuto e CÉSAR JÚNIOR, Roberto Marcondes. A mobile device framework for video captioning using multimodal neural networks. 2023, Anais.. Porto Alegre: SBC, 2023. Disponível em: https://doi.org/10.5753/sibgrapi.est.2023.27457. Acesso em: 27 dez. 2025. -
APA
Damaceno, R. J. P., & César Júnior, R. M. (2023). A mobile device framework for video captioning using multimodal neural networks. In Anais estendidos. Porto Alegre: SBC. doi:10.5753/sibgrapi.est.2023.27457 -
NLM
Damaceno RJP, César Júnior RM. A mobile device framework for video captioning using multimodal neural networks [Internet]. Anais estendidos. 2023 ;[citado 2025 dez. 27 ] Available from: https://doi.org/10.5753/sibgrapi.est.2023.27457 -
Vancouver
Damaceno RJP, César Júnior RM. A mobile device framework for video captioning using multimodal neural networks [Internet]. Anais estendidos. 2023 ;[citado 2025 dez. 27 ] Available from: https://doi.org/10.5753/sibgrapi.est.2023.27457 - SideSeeing: a multimodal dataset and tools for sidewalk assessment
- An end-to-end deep learning approach for video captioning through mobile devices
- Tactile path guidance via weakly supervised visual attention
- Video cropping using salience maps: a case study on a sidewalk dataset
- Towards a method for evaluating bus stop infrastructure with street level images and large language models
- Computação e inovação: ampliando fronteiras para solução de desafios no Brasil
- A Fourier-wavelet representation of 2-D shapes: sexual dimorphism in the Japanese cranial base
- Segmentation of similar images using graph matching and community detection
- ISMM 2007 special issue
- On the ternary spatial relation "between"
Informações sobre o DOI: 10.5753/sibgrapi.est.2023.27457 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3195385.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
