SAM 2 de Meta: innovación en la visión artificial para fotos y videos

SAM 2 de Meta y la segmentación en vídeos

Meta, la empresa responsable de Facebook, Instagram y WhatsApp, entre otras, compartió los últimos avances de SAM 2. Se trata de la nueva versión de su tecnología Segment Anything Model, un modelo de Inteligencia Artificial capaz de segmentar cualquier imagen o vídeo para detectar píxeles de un objeto e ir siguiéndolos. De esta manera, es posible separar de una imagen un actor u objeto puntual, para luego realizar diferentes tareas de edición.

En abril de 2023 habría aparecido SAM de Meta, y en esta nueva versión la Inteligencia Artificial incorpora nuevas funciones y capacidades. Entre lo más destacado de esta nueva presentación hay que resaltar la capacidad de edición de vídeo así como la evolución de los gráficos informáticos y la posibilidad de realizar técnicas interactivas mucho más realistas y versátiles.

Qué incorpora SAM 2 de Meta, la nueva IA de segmentación

Entender el funcionamiento del SAM de Meta y las novedades que trae la segunda versión dan cuenta del avance de la Inteligencia Artificial en el mundo de la tecnología. En primer lugar, el objetivo final de ambas tecnologías sigue siendo el mismo. Fue diseñada para segmentar objetos en imágenes con una alta precisión, facilitando la edición automatizada e identificación de elementos en pantalla. La IA identifica los píxeles que corresponden a un objeto específico, y tiene múltiples usos dentro del mundo de la tecnología.

En disciplinas como las ciencias marítimas, la medicina y el análisis de imágenes vía satélite, por ejemplo, SAM 2 de Meta puede ser una gran herramienta. Algunas de las herramientas que surgieron a partir de la utilización de SAM incluyen Backdrop y Cutouts, de Instagram, que facilitan de manera notable la edición de archivos fotográficos.

Pero el enfoque principal de SAM era de imágenes estáticas. Con esta nueva versión se apunta también al contenido con movimiento, a los vídeos y fragmentos en donde SAM 2 es capaz de determinar y aislar objetos concretos. La complejidad del análisis de un archivo audiovisual es mayor, pero todo indica que Meta está avanzando en la carrera de la Inteligencia Artificial y sus aplicaciones prácticas.

Las nuevas características que incorpora SAM 2 de Meta

El modelo de segmentación de Meta en su versión SAM 2 incorpora nuevas funciones con objetivos muy específicos. Por un lado la posibilidad de realizar segmentación en tiempo real, para detectar objetos en vídeos, pero también un diseño de código abierto y generalización sin adaptación.

Código abierto

Meta lanzó SAM 2 como un código abierto bajo la licencia de uso Apache 2.0. De esta manera, los desarrolladores que así lo deseen podrán construir apps y herramientas personalizadas totalmente compatibles con SAM 2 y sin demasiadas complicaciones.

Dataset SA-V

La nueva versión del modelo de segmentación de Meta incluye un nuevo dataset denominado SA-V. Son aproximadamente 51.000 vídeos extraídos del mundo real y puestos a entrenar la Inteligencia Artificial para añadir distintas funciones y capacidades. Además, también incluye más de 600.000 máscaras espacio temporales para aplicar en tareas de edición de vídeo.

Segmentación en tiempo real

A diferencia del SAM original de Meta, esta versión 2 es capaz de identificar y segmentar objetos en vídeos y acciones en tiempo real. Esta acción también sirve para reducir de manera significativa el tiempo de interacción que el usuario tiene que dedicarle a la app.

Generalización sin adaptación

Con SAM 2 se puede segmentar cualquier objeto en cualquier vídeo o imagen, incluso en aquellos dominios visuales que no se han visto previamente. Se elimina de esta manera la necesidad de una adaptación personalizada a cada caso puntual.

Marco unificado

Los modelos anteriores que trabajaba Meta trabajaban de forma diferenciada imágenes y vídeos. Ahora el enfoque de SAM 2 es cohesivo, logrando así un aprendizaje de nueva técnicas mucho más versátil, y también proporcionando rendimientos consistentes en los diferentes tipos de datos visuales que se analizan.

Segmentación interactiva

SAM 2 también produce otras capacidades interesantes, el usuario puede guiar la atención del modelo con cuadros delimitadores o a través de descripciones puntuales, o haciendo clic. Es un modelo que se adapta muy rápidamente a necesidades específicas y variadas. Al final, con una entrada mínima SAM 2 de Meta podrá identificar objetos con gran precisión.

Cómo funciona la IA SAM 2 de Meta

Velocidad y eficiencia en la segmentación con SAM 2 de Meta

La Inteligencia Artificial de Meta en su versión SAM 2 añade velocidad y eficiencia en el proceso de segmentación de objetos. Los desarrolladores han permitido crear una plataforma que analiza con resultados rápidos y eficientes toda clase de elementos, desde fotos y vídeos, hasta descripciones puntuales en texto.

Procesamiento de imágenes en alta resolución

SAM 2 también trabaja con imágenes en alta calidad. Puede manejar fotos con hasta 4 veces la resolución que soportaban las versiones anteriores del modelo. Esto garantiza resultados mucho más vistosos y realistas. Es una gran mejor a la hora de hacer análisis y escaneo en campos de imagen como la medicina o la interpretación de mapas satelitales.

A mayor definición, más fácil y rápido se pueden segmentar los objetos e individualidades. El corazón de SAM 2 es brindar una herramienta versátil, capaz de adaptarse rápidamente y volcar estupendos resultados para acciones varias.

¿En qué se puede aplicar SAM 2?

Entendiendo el gran avance de la Inteligencia Artificial y los trabajos para su extensión, es interesante ver los campos en donde Meta ha decidido volcarse. A través del modelo SAM 2 se pueden esperar avances en diferentes campos. Desde la edición de vídeo en tiempo real y de forma automatizada, hasta las acciones de automatización y robótica.

También las áreas de medicina y ciencia están muy relacionadas con la Inteligencia Artificial, pudiendo utilizar estos avances para desarrollar estrategias novedosas. Los ingenieros informáticos en Meta también están trabajando fuertemente para que SAM 2 tenga usos específicos y permita avanzar a mayor velocidad en áreas relacionadas con la anotación y vuelco de datos. Plataformas que recopilan distintos datos pueden usar SAM 2, hallar patrones y acelerar de manera exponencial la velocidad en la que aparecen resultados. El horizonte todavía está lejos de estar a la vista. La IA está en su mejor momento y Meta no quiere perderse el tren. Con sus desarrolladores trabajando a toda velocidad, y SAM 2 con tantos frentes, puede ser una gran propuesta.


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.