ByteGPT:Nuevas plantillas v2: contexto, diferencias, ventajas y cómo elegir
¿Tienes prisa? Vea un resumen aquí
- ByteGPT v2:
- Detección de voz, imágenes, archivos y stickers de forma nativa (sin “LOG OK”).
- Flujos "limpiador" y configuraciones modulares.
- JSON + Dify: enviar datos desde Kommo para lógica avanzada o múltiples LLM.
- Si vas a empezar ahora ou quieren crecer en recursos, v2 es el orden.
- ByteGPT v1:
- Todavía funciona bien para aquellos que solo usan texto/audio y no necesitan flujos complejos.
- No tiene detección automática de tipo de medio ni integraciones JSON avanzadas.
- ¿Por qué Dify?
- Orquesta varios modelos (OpenAI, Gemini, Claude y más).
- Admite transcripción, análisis de archivos y uso de visión (para imágenes).
- Puedes ejecutarlo en las nubes o en autohospedada (gratis si eres anfitrión).
- Ideal para niños pequeños flujos complejos que requieren variables, solicitudes HTTP y automatización adicional.
- Consejos de migración para v2:
- Cambie el controlador a “handlerV2”.
- Incluir Pausa de 5 segundos en el bloque para que la API detecte el tipo de medio.
- Prueba de envío de audio, imágenes y archivos.

Introducción
Las nuevas actualizaciones de ByteGPT presentar el plantillas v2, que facilitan la configuración, amplían el soporte para diferentes tipos de medios (voz, imagen, archivo y sticker) y abren espacio para integraciones avanzadas, como el envío de datos en JSON para Dify. Si estás en la v1 y estás pensando en migrar, o estás eligiendo la mejor versión para comenzar, esta guía te muestra las principales diferencias, ventajas y mejores prácticas.
O ByteGPT puede operar con ChatGPT (API) o con varios “Proveedores” (OpenAI, Dificar, n8n, Base de chat). Cada uno ofrece una forma única de integrar capacidades de IA a su fluir en Kommo CRM — y conectándose específicamente con el Dificar, orquestas virtualmente cualquier modelo de lenguaje (OpenAI, Gemini, Claude, DeepSeek, entre otros) en un solo lugar, personalizando flujos de chatbot, enviando solicitudes HTTP y utilizando herramientas de automatización avanzadas.
1. Descripción general de ByteGPT
O ByteGPT es una solución de Inteligencia Artificial integrada en Kommo CRM, capaz de crear un chatbot híbrido que combina los flujos tradicionales de Salesbot con modelos de lenguaje avanzados (GPT). En la práctica, esto permite:
- Responda preguntas frecuentes las 24 horas del día, los 7 días de la semana.
- Interpretar mensajes en lenguaje natural (incluyendo voz e imagen).
- Ofrecer un servicio inteligente y personalizado, como el ByteGPT Se puede configurar con datos y avisos específicos de su empresa.
Con la evolución hacia la Versión 2 (v2) de las plantillas, la ByteGPT se ha vuelto aún más flexible y fácil de mantener, especialmente en términos de manejo de medios y Integración con plataformas como Dify y n8n.
2. ¿Por qué hay dos versiones de plantillas (v1 y v2)?
Versión v1
- Fue el primera generación de plantillas ByteGPT, inicialmente centrado en texto y audio.
- La transcripción del audio se realiza después de pasar por el Webhook ChatGPT (paso 187) y luego se envía como texto (transcrito) al Asistente.
- permite el interpretación de la imagen, pero depende de configuraciones específicas en la transmisión, según el retorno del campo ByteGPT+ | LOG, activando una solicitud específica en el paso 235 si el campo ByteGPT+ | LOG contiene #imagen. Esto le permite personalizar el análisis o la solicitud según sea necesario.
- Sigue siendo funcional y sirve a aquellos que no necesitan funciones de identificación de medios más avanzadas o transmisiones más “limpias”.
Versión v2
- ofertas plantillas más organizadas, con la opción de habilitar/deshabilitar la identificación de un mensaje de audio, imagen, archivo o pegatina.
- La transcripción de audio se realiza automáticamente y se envía en formato de texto (transcrito) para que el Asistente responda. No es necesario pasar por el Webhook para transcribir.
- Facilita el desarrollo de flujos personalizados dentro de Salesbot, ya que cada tipo de medio (#voz, #imagen, #sticker, #archivo) es detectado automáticamente en el LOG, permitiendo ramas específicas.
- Se integra de alguna manera más transparente a Dify y n8n, permitiendo el envío de datos en JSON, transcripción de audio y análisis de imágenes.
- requiere Adecuación para quienes utilizan la plantilla v1 (por ejemplo, eliminar la marca de verificación “LOG OK” de la plantilla), pero aporta mayor flexibilidad y claridad a los bloques de Salesbot en la plantilla v2.
En resumen: v2 es una evolución que hace la configuración del ByteGPT más intuitiva, pero la v1 sigue disponible para aquellos que ya están acostumbrados o no necesitan las nuevas funciones.
3. Principales cambios y novedades en la versión 2
3.1. Plantillas más limpias y modulares
Los flujos v2 se han rediseñado para facilitar la lectura y el mantenimiento. Los bloques de Salesbot están más segmentados y organizados, lo que le permite ajustar las indicaciones y las respuestas de manera intuitiva, lo que facilita la Flujo más limpio y eliminación de nodos redundantes.
3.2. Identificación nativa de tipos de mensajes
En la versión 2, identificación de audio, imágenes, archivos y pegatinas se realiza internamente mediante nuestra API, sin la necesidad de un webhook específico en Salesbot para reconocer el tipo de medio. Para ello existe una Intervalo de 5 segundos en el bloque Salesbot, tiempo necesario para que la API analice el mensaje y devuelva el LOG apropiado, por ejemplo, #voz, #imagen, #pegatina o #archivo. De esta manera, Salesbot puede dirigir cada tipo de contenido al bloque correcto.
Ya en la v1, se utilizaba un LOG “OK” genérico para confirmar acciones, lo que limitaba la creación de ramas específicas para cada formato de medio.
3.3. Procesamiento de voz, imágenes, archivos y pegatinas
La v2 formaliza la detección y tratamiento de cada tipo de medio, sin necesidad de ampliar el flujo. Esto amplía el campo de acción de ByteGPT a:
- Reconocimiento de voz: Transcripción automática de audio.
- Interpretación de la imagen: con indicaciones específicas (por ejemplo, analizar el contenido de una foto).
- Archivos y pegatinas: poder enviarlos al Asistente (OpenAI, Dify, n8n o Chatbase) o tratarlos según la lógica de tu flujo en Kommo.
3.4. Controlador V2 actualizado y pausas
- Cualquiera que migre de v1 a v2 deberá actualizar la URL del controlador agregando “V2” al final (por ejemplo, …/handlerV2).
- Se recomienda insertar una pequeña “pausa”, de 5 segundos (por ejemplo, en el paso 253 de la plantilla), para dar tiempo a ByteGPT identificar el tipo de medio antes de responder.
3.5. Integración avanzada con Dify o n8n
La versión 2 lo deja aún más claro integración con Dify o n8n:
- Los audios se transcriben automáticamente, sin necesidad de ninguna configuración extra.
- En el caso de imágenes y archivos, si Dify o n8n pueden recibirlos, el ByteGPT Puede generar indicaciones especializadas para analizar este contenido.
- el flujo de enviando en JSON le permite pasar valores de campo desde Kommo para que Dify o n8n ejecuten lógica personalizada.
4. Nuevas plantillas en la versión 2: Las tres variantes principales
Al acceder a las nuevas plantillas ByteGPT v2, encontrarás (normalmente) tres modelos:
1. Proveedor ChatGPT + (OpenAI, Dify, n8n, Chatbase)
- Combinación de ChatGPT y un proveedor (OpenAI, Dify, n8n o Chatbase) en el mismo flujo.
- ChatGPT se puede utilizar para tareas internas; por ejemplo, un “aviso de intención” para analizar el mensaje sin involucrar al Asistente principal, o para generar ejemplos, resúmenes y análisis de puntos en el tiempo.
- El uso paralelo evita la “contaminación” en el contexto del Asistente principal, manteniendo intactas las instrucciones específicas de la empresa.
- Es posible activar o desactivar el Asistente según sea necesario, o incluso combinar ambos: por ejemplo, ChatGPT evalúa la intención y luego redirige la conversación al Asistente principal, que tiene las instrucciones y el conocimiento comercial.
2. JSON a Dify o n8n
- Habilita enviar datos en formato JSON directamente a Dify o n8n, brindando flexibilidad para integrar campos específicos de Kommo (por ejemplo, pistas o contactos).
- En lugar de pasar esta información en el mensaje del usuario (sys.query), la envía como parámetros de entrada para Dify o n8n. Debe crear variables de entrada (en el bloque Inicio) en Dify o n8n. Se debe ingresar el mismo nombre que la variable Dify en el bloque Salesbot. Kommo, e informar al campo de Kommo correspondiente.
- Permite buscar datos externos, crear condiciones e insertar variables en instrucciones Dify o n8n, habilitando flujos avanzados de automatización y lógica personalizada.
Diferencia entre plantillas JSON y Dify o n8n
La gran diferencia es la posibilidad de establecer valor JSON que será enviado a Dify o n8n. Por ejemplo, ingresar algo como:
{
"variavel_dify1":"[Campo Kommo 1]",
"variavel_dify2":"[Campo Kommo 2]",
"variavel_dify3":"[Campo Kommo 3]"
}
La última línea no tiene coma.
Asegúrese de que cada variable definida en “dify_variable1” también se cree dentro de su aplicación Dify.
Puedes pasar tantos campos como quieras, separándolos con comas (excepto el último). Preste atención a los espacios adicionales, que no deberían existir.
Obtenga más información sobre las actualizaciones de campo en Kommo con Dify o n8n en el artículo: Cómo actualizar campos Kommo uso ByteGPT + Dify o n8n
3. Proveedor (OpenAI, Dify, n8n, Chatbase)
- En esta opción, Sólo el Proveedor se utiliza — toda la interacción y personalización del mensaje ocurre dentro del propio Proveedor elegido (OpenAI, Dify, n8n o Chatbase), sin Involucrar a ChatGPT en pasos paralelos.
- Es un modelo más esbelto y directo, ideal para quienes desean que todas las discusiones permanezcan dentro del Asistente, con mayor libertad para personalizar el flujo.
- En el caso de Dify, todavía es posible utilizar el clasificador de preguntas (actuando como un aviso de intención) o configurar rutas específicas para diferentes escenarios, proporcionando máxima flexibilidad en la construcción del flujo.

Plantilla para n8n:
5. ¿Cómo elegir entre v1 y v2?
Escenario 1: Flujos básicos y sin demanda de nuevos medios
- Si tus flujos solo funcionan con texto y audio simples, sin necesidad de diferenciar o analizar imágenes, archivos o stickers, y no requieren integración JSON con Dify o n8n, v1 funciona bien.
- Si todo funciona correctamente y no son necesarias funciones más complejas, puedes conservar la v1 sin preocupaciones.
Escenario 2: Necesidad de integraciones de voz, imágenes, archivos y avanzadas
- Si usted desea tratar diferentes tipos de medios (voz, imagen, archivos, stickers) de forma nativa en el flujo, v2 lo hace internamente, sin depender de LOG “OK” o configuraciones adicionales.
- Para los que quieren integraciones dinámicas con Dify o n8n (como enviar datos de CRM a través de JSON), cree ramas específicas y aproveche las mejoras de estabilidad, v2 es la mejor opción.
Escenario 3: Empezando ahora o planeando crecer
- Si tu está empezando para utilizar el ByteGPT, o prevé Implementaremos más funciones en el futuro, v2 es Muy recomendable.
- Proporciona mayor organización, compatibilidad con funciones futuras y facilita la expansión para nuevos medios, integraciones y flujos de trabajo avanzados según sea necesario.
6. Integración con Dify y envío de medios
¿Por qué es relevante Dify?
- Orquesta múltiples modelos de IA: Puede seleccionar el proveedor más adecuado (OpenAI, LLaMA, Claude, etc.) para cada paso del flujo de trabajo, incluidos los modelos que admiten la visión o el procesamiento de archivos.
- Transcribe y analiza archivos de forma nativa: Dify puede transcribir audio, extraer información de documentos e interpretar imágenes sin necesidad de integraciones adicionales.
- Facilidad de integración con ByteGPT: Sirve como un “centro” donde se configura la lógica avanzada; por ejemplo, qué modelo LLM usar para cada tipo de medio o cómo manejar las variables enviadas en JSON por Salesbot.
Mejores prácticas al utilizar Dify
- Seleccione el modelo LLM apropiado:
- Si desea analizar imágenes (Visión) o manejar archivos, active o elija un modelo que admita estas funciones dentro de Dify.
- En caso de enviar imágenes, verificar si el modelo reconoce o interpreta imágenes, en caso contrario utilizar un bloque específico que soporte el análisis de contenido visual.
- Bloques de extracción de documentos:
- Para manipular archivos de texto o PDF, utilice el bloque de extracción Dentro de Dify.
- Este bloque le permite “leer” el contenido del archivo y enviarlo a otro bloque LLM para su posterior análisis o resumen.
- Referencia a archivos sys.files en bloques LLM:
- Al enviar archivos (imagen, audio, PDF, etc.) a través de ByteGPTDify puede registrar este contenido en el campo sys.files.
- Haga seguro indicar archivos sys. en el bloque LLM para que el modelo tenga acceso al archivo y pueda interpretarlo correctamente.
- Usando JSON para variables específicas:
- Si desea transmitir información sobre Kommo (ID de cliente potencial, datos de contacto, etc.) o llame a API externas, aproveche la integración a través de JSON.
- Puede parametrizar variables en el flujo de Salesbot y enviarlas a Dify, que ejecutará la lógica o consulta necesaria antes de devolver la respuesta.
- Ejemplos de aplicación:
- Audios: O ByteGPT envía el audio a Dify, que lo transcribe automáticamente y devuelve el texto para su procesamiento en la transmisión.
- Imágenes: Si está configurado para aceptar imágenes, Dify interpreta el archivo y devuelve una descripción o análisis según sus indicaciones.
- documentos: Utilice bloques de extracción para procesar el contenido del archivo y luego dirija el texto a un LLM para generar un resumen, información o respuestas contextualizadas.
Siguiendo estas recomendaciones, aprovecharás todo el potencial de Dify para crear flujos de chatbot más inteligentes, integrados y personalizados en ByteGPT.
7. Migración: Qué tener en cuenta al migrar a v2
- Manejador: cambia la URL, agregando “V2” (por ejemplo: …/handlerV2).
- Comprobación del REGISTRO “OK”:si su flujo anterior dependía de esto, revíselo para que no cause errores (v2 no usa este LOG).
- Pausa para la identificación de los medios:incluir un rango (por ejemplo, en el paso 253) para el ByteGPT procesar adecuadamente el mensaje recibido.
- Pruebas en Salesbot: Simular el envío de mensajes de audio, imágenes, archivos, etc., para garantizar que cada rama del flujo esté funcionando.
8. Consideraciones finales
A Versión 2 de las plantillas de la ByteGPT representa un gran salto para aquellos que quieren automatizar el servicio mediante texto, voz, imagen o archivos de formato organizado, eficiente y escalable. Sus flujos son más “limpios” y las configuraciones modulares facilitan la creación de experiencias diferenciadas para cada tipo de medio, además de integraciones avanzadas (como JSON + Dify).
- Si tu ya usa v1 y desea migrar, simplemente revise el flujo para eliminar la dependencia de “LOG OK”, actualice el controlador a “handlerV2” y ajuste las pausas o verificaciones requeridas para cada tipo de medio.
- Se empezará desde cero, elija v2 directamente para disfrutar de todas las últimas funciones.
- Usted puede utilizar MCP (Model Context Protocol) fácilmente a través de n8n y Dify, o incluso interconectar los dos (Dify llamando a algún MCP n8n, por ejemplo), facilitando las integraciones entre herramientas como Google Calendar, Google Sheets, Database y muchas otras.
Recomendación: Utilice Dify o n8n para mejorar su proyecto de IA
O Dificar es una excelente manera de orquestar diferentes modelos de IA (OpenAI, Gemini, Claude, entre otros), ya que ofrece mayor flexibilidad y automatización, ya sea en una suscripción a los planes Dify o en el autohospedada. Para comprender las ventajas de utilizar Dify en lugar de solo OpenAI, recomendamos:
- ¿Por qué utilizar Dify en un proyecto de chatbot?
- Vídeo: Dify + ByteGPT + Kommo:El poder de la IA para un CRM más eficiente
Pasos siguientes
Si tienes alguna pregunta sobre integraciones, enviando medios ou indicaciones especiales, consulta nuestros tutoriales y materiales adicionales de Bytebio o contacte con el soporte técnico.
Independientemente del escenario — soporte técnico, preventas, Preguntas Frecuentes ou transmisiones multimedia — v2 es la base ideal para aprovechar todo el potencial de la IA en Kommo Gestión de relaciones con el cliente. Si necesita ayuda con la configuración o la migración, Hablar con soporte técnico. El equipo Bytebio está listo para guiarlo y garantizar que su ByteGPT alcanzar el máximo rendimiento.