12 puntos por xguru 2024-06-20 | 1 comentarios | Compartir por WhatsApp
  • ETL basado en Python diseñado para extraer, preparar y organizar datos desde diversas fuentes y formatos
    • Compatible tanto con archivos estructurados como no estructurados (CSV, Parquet, PDF, Word, HTML, etc.)
  • Su objetivo es ayudar tanto a científicos de datos como a ingenieros de datos a desarrollar fácilmente pipelines con una interfaz intuitiva de low-code, al mismo tiempo que genera código Python que puede desplegarse en cualquier lugar
    • Diseña pipelines de datos con una GUI y genera código Python nativo que puede desplegarse en cualquier entorno on-premise o en la nube
  • Ofrece un rendimiento sobresaliente en integración de datos de archivos a bases de datos, extracción y preparación de datos para ciencia de datos y sistemas basados en LLM, así como consulta y enriquecimiento de APIs

1 comentarios

 
xguru 2024-06-20
Comentarios en Hacker News
  • Amphi es una herramienta ETL low-code para datos estructurados y no estructurados, útil para integrar archivos, preparar datos, migrar datos y crear pipelines de datos para tareas de IA. Genera código Python que puede desplegarse en cualquier lugar.
  • No siempre es bueno hacer que el trabajo de datos sea fácil para personas sin formación en el área. Si escribir Python y SQL te resulta difícil, quizá sea mejor considerar otra cosa.
  • Hay que cambiar el título. No es open source, sino que usa la licencia Elastic License v2.
  • No es open source. El título induce a error.
  • Para quienes no conocen la sigla ETL, sería bueno agregar una explicación en el sitio web.
  • Como herramientas Python ETL open source, dlthub.com y hub.meltano.com son mejores opciones. Uso Meltano de verdad y estoy satisfecho.
  • Me pregunto si Amphi soporta el framework rapidsai dask_cudf, similar a pandas.
  • La idea es buena, pero la abstracción de alto nivel en la documentación está mal planteada. Debería poder definirse algo que se comporte como una tabla dentro de un pipeline de datos y aplicarle transformaciones. El hecho de que sea una herramienta gratuita es digno de elogio.
  • Estoy satisfecho con Dagster, pero Amphi también me parece interesante.
  • Me pregunto cómo nació una herramienta como Amphi. Ya existen muchas herramientas Python ETL open source, así que me gustaría saber si se creó para resolver un problema específico o si fue un proyecto por pasión.