7 puntos por xguru 2020-03-02 | 1 comentarios | Compartir por WhatsApp
  • Herramienta de investigación y análisis de datos para periodismo de investigación creada por OCCRP, especializada en investigaciones sobre crimen organizado y corrupción

  • Búsqueda cruzada integrada de datos estructurados (DB) y no estructurados (PDF, XLS, DOC, etc.)

  • Funciones de segmentación de datos y gestión de accesos. Admite compartición flexible entre equipos multinacionales

  • Rastreo continuo desde cientos de fuentes de datos públicas

  • Ofrece análisis de investigación visual

  • Soporte para importación de datos

  • Desde HTML/XML, PDF, RTF, Epub y la mayoría de documentos de oficina (Doc, PPT)

  • Formatos tabulares como XLS/CSV y DBF, SQLite, Access

  • Correos electrónicos RFC822 MIME, buzones como Outlook PST/OLM, Mbox, Vcard

  • Zip, Rar, Tar, 7Zip, Gzip

  • JPEG, PNG, GIF, TIFF, SVG extraen texto mediante OCR con Tesseract 4 o Google Vision API

1 comentarios

 
xguru 2020-03-02

OCCRP, que es la organización que lo creó, es este tipo de entidad.

"OCCRP, un medio de investigación especializado en crimen organizado y corrupción" https://newstapa.org/article/_DNLi

Pueden probarlo con datos reales en https://aleph.occrp.org/.

El video tráiler hecho por OpenOil explica Aleph de manera sencilla.

( OpenOil es una empresa que crea un framework de datos abiertos para gestionar recursos naturales en todo el mundo, como gas, petróleo y carbón. )

https://www.youtube.com/watch?v=bg96HcR_2Jc

Como fue creado por una organización de investigación especializada en la "corrupción", su modelo de datos base es "Follow the Money".

Rastrea muy bien cómo fluye el dinero entre distintas empresas y personas.

Por eso, los tipos de entidades de conjuntos de datos que admite de forma predeterminada son los siguientes.

  • Airplane, Assessment, Asset, Bank Account, Company, Contract, Court case, Customs Declaration, Land, Legal Entity