6 puntos por seawolf 2023-04-03 | Aún no hay comentarios. | Compartir por WhatsApp

Probablemente muchos de ustedes aquí piensen lo mismo, quería intentar crear al Jarvis de Iron Man en la vida real.

Quiero publicar gratis la versión alfa de prueba de 'BooCae', un servicio de plataforma de personalidad de chatbot de IA personalizada, y escuchar distintas opiniones como bugs o puntos de mejora.
Como su nombre indica, les pido que lo vean como una prueba experimental, y seguimos agregando funciones de forma continua.

‘BooCae’ se planteó como una plataforma de ‘personalidad de chatbot de IA personalizada’ basada en ChatGPT, combinada con varios modelos de IA de gran escala como LLAMA y ALPACA, además de diversas API y plugins.
Los chatbots de IA de BooCae tienen en común que están basados en la API de ChatGPT-3.5-Turbo, con un ‘aprendizaje personalizado’ configurado de forma independiente para cada área. Este servicio de prueba alfa también incluye un avatar de IA multimodal que puede operarse.
El modelo para crear avatares con IA fue desarrollado aparte como una 'app nativa', y todavía no se ha publicado en ninguna tienda; actualmente se está probando fuera de línea. (Esto lo presentaré por separado más adelante).

Casualmente, un modelo similar es 'Character.AI' en Estados Unidos, y tomando ese sitio como referencia, hice varios esfuerzos para mejorarlo y diferenciarlo a mi manera.

La estructura de la configuración básica del servicio y sus puntos diferenciales son los siguientes.

-AI model: se aplicó ChatGPT como base, y pronto se añadirán también otros GPT como Alpaca y Llama. En el caso de ChatGPT, la base es GPT3.5-TURBO mediante Open API. (También hay que considerar la velocidad de respuesta y el costo, claro).

-AI persona: por defecto se utilizó un conjunto estándar de prompts definido como asistente de IA, con algunas modificaciones para adaptarlo al contexto coreano. Esto también se planea seguir actualizando.

-Conjunto de datos adicional para aprendizaje personalizado: con base en información pública (portal de información pública, información pública sin copyright, etc.), se entrenaron experimentalmente contenidos como noticias y diccionarios, y seguimos mejorando su cantidad y calidad. A futuro también considero necesaria la compra de datos profesionales de pago.

-API para consulta de información en tiempo real: para usar datos en tiempo real (por ejemplo, tipo de cambio), se utilizaron varias API y se siguen agregando más. La consulta de API en tiempo real también es algo que debe considerarse desde el punto de vista de costos.

-Plataforma de chatbot: existen diversas plataformas de chatbot, desde versiones públicas hasta versiones comerciales, por lo que se utilizaron módulos y API de varias de ellas, y queremos que pueda soportar todavía más plataformas.
Las plataformas de chatbot se basan en gran medida en una estructura que permite configurar condiciones como escenarios. Puede tratarse de casos donde ChatGPT viene integrado por defecto (aunque en ese caso muchas veces cuesta considerarlo realmente una plataforma de chatbot), o de una estructura donde no viene integrado pero la API está abierta y ChatGPT puede conectarse configurando manualmente la API.
Creo que ambas opciones tienen sus propias ventajas.
Lo importante es ampliar la diversidad para poder soportar libremente más plataformas.

-Aplicación y despliegue: puede definirse mediante widget web, enlace URL o formato API, y con ello es posible dar soporte multiplataforma para web / web app / app nativa / o servicios de voz como Google Assistant.

-Función de búsqueda: para registrar y aprovechar palabras clave, se aplicó tal cual la función de búsqueda que ofrece Notion, y también considero que la estructura de la base de datos es muy útil.

-Publicidad: pensando en un modelo de ingresos, se realizó una prueba experimental bajo la premisa de mostrar anuncios patrocinados cada vez que la IA responde.
La forma de la publicidad sería, según veo: 1) video 2) imagen 3) texto y URL 4) inclusión de contenido tipo PPL dentro de la respuesta.

-Avatar de IA: el mayor punto de diferenciación preparado está en el aspecto multimodal. Considero que el verdadero avatar de IA multimodal definido por BooCae es aquel en el que se aplican de manera combinada generación de texto mediante IA, generación/clonado/síntesis de voz, generación de imágenes, composición en video y procesamiento de video como fondos.
La mayoría de las imágenes de video publicadas en la prueba alfa de BooCae fueron creadas usando herramientas como Wav2LIP, y en las pruebas previas se juzgó que la reacción de los usuarios era claramente alta, por lo que me enfoqué en ello como punto diferencial.

La plataforma del servicio usa 'Notion' y el sitio fue construido con oopy.
Se definieron varias decenas de categorías de servicio, y creo que esto seguirá aumentando.
Según la composición de clases del servicio, se clasifica en Special (especial), Brand (servicios de marca como empresas), Expert (servicio de expertos), Ready (aprendizaje en progreso) y Comming soon (en espera de aprendizaje).

Dentro de los avisos también se incluye un formulario de encuesta para conocer la reacción al servicio y escuchar opiniones, así que agradeceré muchos comentarios francos.

Todavía está en etapa de prueba alfa, así que hay muchas carencias en varios aspectos.
También hace falta un equipo para construir juntos el proyecto. Si a alguien le interesa, le agradeceré que me escriba por chat.

URL de la prueba alfa: https://boocae.oopy.io/

Aún no hay comentarios.

Aún no hay comentarios.