- Un asistente de IA con voz y visión que puede usarse en todas las aplicaciones de macOS
- Al presionar el atajo de teclado y hacer una pregunta por voz, genera una respuesta hablada basada en el contexto actual
- Toma una captura de pantalla de la ventana actual y la envía a OpenAI GPT Vision
- La pregunta se transcribe usando la API de OpenAI Whisper y se envía junto con el texto
- La respuesta de texto recibida se convierte en voz usando OpenAI TTS y se reproduce
- Desarrollado con NodeJS/Electron
- El atajo predeterminado es Cmd + Shift + '
1 comentarios
Comentarios en Hacker News
Pregunta si es mejor usar el término "macOS" en el prompt en lugar de "OSX", o si simplemente no le dio mucha importancia a lo que eligió al principio.
En respuesta, sugieren agregar una opción de texto en streaming en lugar de TTS.
Mencionan que escribieron un script similar para una configuración de Linux.
Recomiendan establecer un límite de gasto al usar la API de OpenAI.
Reacción positiva al proyecto.
Preguntan si hay planes de hacer que el proyecto funcione con LLMs locales en lugar de "open"AI.
Opinan que les gustaría construir algo integrado directamente en la terminal.
Reacción negativa ante la información de que "macOSpilot usa NodeJS/Electron".
Comparten su experiencia usándolo con la estación de trabajo de audio digital Ableton Live.
Comparten una fantasía sobre la productividad mientras esperan el resultado del comando
ls.