- Buscar escenas específicas dentro de un video usando la red neuronal CLIP de OpenAI
→ Buscar imágenes dentro del video como "Road Works", "People crossing the street" y "Fire truck"
Cómo funciona
-
Descargar el video de YouTube
-
Extraer cada fotograma
-
Codificar todos los fotogramas con CLIP
-
Codificar la búsqueda en lenguaje natural con CLIP
-
Encontrar una escena específica usando la búsqueda en lenguaje natural
- Se puede ejecutar directamente como notebook en Google Colab
1 comentarios
En los comentarios, el mismo desarrollador también tiene una búsqueda de imágenes de Unsplash hecha con CLIP; esto también parece muy útil.
https://github.com/haltakov/natural-language-image-search
Google Colab: https://colab.research.google.com/github/haltakov/…
Te encuentra la foto con el contenido que quieres entre los 2 millones de fotos subidas a Unsplash.