Logo de Mydra
Artificial Intelligence
DeepLearning.AI logo

DeepLearning.AI

Introducción a Llama Multimodal 3.2

  • hasta 1 hora
  • Principiante

Explora las características del nuevo modelo Llama 3.2, incluyendo clasificación de imágenes, razonamiento visual y uso de herramientas. Aprende sobre la solicitud, tokenización y la pila de Llama para construir aplicaciones de IA.

  • Clasificación de imágenes
  • Razonamiento visual
  • Uso de herramientas
  • Solicitud
  • Tokenización

Resumen

Únete a nuestro nuevo curso corto, Introducción a Llama Multimodal 3.2, y aprende de Amit Sangani, Director Senior de Ingeniería de Socios en Meta, sobre las últimas adiciones a los modelos Llama 3.1 y 3.2. Descubre las nuevas capacidades de visión, el uso de herramientas y la Llama Stack, una capa de orquestación de código abierto para construir sobre la familia de modelos Llama. ¡Comienza a construir aplicaciones emocionantes en Llama!

  • Web Streamline Icon: https://streamlinehq.com
    Online
    ubicación del curso
  • Layers 1 Streamline Icon: https://streamlinehq.com
    Inglés
    idioma del curso
  • A tu propio ritmo
    formato del curso
  • Clases En vivo
    entregado en línea

¿Para quién es este curso?

Entusiastas de la IA

Cualquiera interesado en explorar las características del nuevo modelo Llama 3.2.

Desarrolladores

Desarrolladores que buscan aprender sobre la solicitud, tokenización y uso de herramientas de Llama 3.2.

Investigadores de IA

Investigadores interesados en la pila de Llama y en construir aplicaciones de IA.

Descubre las últimas características de Llama 3.2, incluyendo clasificación de imágenes y razonamiento visual. Ideal para entusiastas de la IA, desarrolladores e investigadores, este curso te ayudará a construir aplicaciones innovadoras de IA.

Requisitos Previos

1 / 1

  • Conocimientos básicos de Python

¿Qué aprenderás?

Introducción a Llama 3.2
Aprende sobre los nuevos modelos, cómo fueron entrenados, sus características y cómo se integran en la familia Llama.
Solicitud Multimodal
Entiende cómo realizar solicitudes multimodales con Llama y trabaja en casos de uso avanzados de razonamiento visual.
Roles y Formato de Solicitud
Aprende sobre los diferentes roles—sistema, usuario, asistente, ipython—en la familia Llama 3.1 y 3.2 y el formato de solicitud que identifica esos roles.
Tokenizador Tiktoken
Entiende cómo Llama utiliza el tokenizador tiktoken y cómo se ha expandido a un tamaño de vocabulario de 128k.
Uso de Herramientas
Aprende cómo solicitar a Llama que use tanto herramientas integradas como personalizadas con ejemplos para búsqueda web y resolución de ecuaciones matemáticas.
API de Llama Stack
Aprende sobre la 'API de Llama Stack', una interfaz estandarizada para componentes de cadena de herramientas canónicas para personalizar modelos Llama.

Conozca a su instructor

  • Amit Sangani

    Director Senior de Ingeniería de Socios en Meta

Próximos cohortes

  • Fechas

    comienza ahora

Libre