1 puntos por GN⁺ 2025-10-20 | 1 comentarios | Compartir por WhatsApp
  • El costo de la secuenciación de ADN está disminuyendo más rápido que la ley de Moore.
  • Con Oxford Nanopore MinION, puedes secuenciar ADN en casa por alrededor de $1,100.
  • En la prueba real se realizaron pasos como extracción de sangre, extracción de ADN y secuenciación con Nanopore.
  • Al final, se cubrió solo aproximadamente el 13% del genoma completo y el análisis fue limitado por contaminación, fallas del equipo y otros factores.
  • Aun así, fue una experiencia valiosa para secuenciar parte de tu propio ADN de forma económica.

Introducción

  • El costo de la secuenciación de ADN está cayendo con rapidez, y ahora es posible hacer por cuenta propia lo que antes tomó 13 años y 2,300 millones de dólares (el descifrado del genoma humano) con solo un equipo de Oxford Nanopore (aprox. $1,000) en menos de 48 horas.
  • Antes, era necesario enviar las muestras a un tercero externo inestable; en este artículo se intenta secuenciar en un entorno sin laboratorio propio.

Resumen del proceso de secuenciación de ADN

  • El objetivo era obtener la secuencia del genoma humano (unas 3,000 millones) de A, C, G y T a partir de 10 ml de sangre.
  • Resumen de las etapas completas
    • Toma de sangre
    • Extracción de ADN humano de la sangre
    • El ADN extraído se hizo pasar por el equipo de Oxford Nanopore mediante un método eléctrico para leer cada nucleótido

Breve historia de la secuenciación de ADN

  • Era Sanger (1960~2003): basada en métodos analógicos, procesamiento manual y avance muy lento
    • Usaba nucleótidos con defectos para cortar la replicación del ADN, separaba cada fragmento por electroforesis y luego lo leía como si fuera un código de barras.
    • El desciframiento del genoma humano llevó 13 años y costó 2,300 millones de dólares.
  • Era Illumina (2005~década de 2010): paralelización y automatización
    • Se introdujo el método de secuenciación por síntesis, mejorando fuertemente la velocidad y eficiencia.
  • Era de secuenciación de molécula única:
    • Lee directamente las bases del ADN a través de nano poros eléctricos, sin necesidad de fragmentar el material.
    • Este experimento también utilizó este enfoque.

Equipamiento y costo necesarios

  • Kit de inicio de Oxford Nanopore MinION ($1,000): secuenciador USB, incluye flow cell y reactivos de preparación.
  • Kit de extracción de ADN de Zymo (muestra gratuita)
  • Mini centrífuga (Amazon, $50)
  • Materiales de laboratorio descartables (tubos Eppendorf, lancetas, pipetas, etc., $50)
  • Costo total aproximado: $1,100

Detalle de los pasos del experimento

Paso 1: Toma de sangre

  • Se requieren unos 200 µL (0.2 ml) de sangre; como una lanceta pequeña no bastaba, se tomó sangre pinchando el dedo repetidamente.

Paso 2: Extracción de ADN

  • La sangre contiene muchos componentes sin ADN, como los eritrocitos.
  • Hay que aislar el ADN solo de los leucocitos, y en este experimento se hizo con las enzimas y el filtro centrífugo del kit de Zymo.
  • También se siguió el proceso de añadir adaptadores del kit de preparación de Nanopore.

Paso 3: Secuenciación con Nanopore

  • Se inyectó el ADN preparado en el puerto pequeño de MinION y se conectó por USB.
  • El software MinKNOW realiza basecalling en tiempo real, prediciendo A, T, C y G a partir de señales eléctricas mediante un algoritmo de red neuronal.

Resultados y limitaciones

  • Se logró secuenciar en total cerca de 1 gigabase de datos en dos rondas (aproximadamente el 13% de los 3,000 millones de bases del genoma humano completo).
  • El primer ensayo se interrumpió por un error de hardware, con una flow cell defectuosa (solo 623 poros funcionaban de 2,048).
  • Se detectó un 25% de contaminación, principalmente bacteriana.
  • Para el análisis de SNP (polimorfismo de un solo nucleótido) se requiere secuenciar varias veces, pero la mayoría de las cadenas solo se leyeron una vez, sin solapamiento.
  • Aun así, con un costo bajo de $1,100, se obtuvo una experiencia válida de secuenciación de parte del genoma humano.

Agradecimientos

  • Agradece a los amigos que participaron en este experimento

1 comentarios

 
GN⁺ 2025-10-20
Opiniones en Hacker News
  • Todavía es difícil decir que ya entramos en la “era de la secuenciación por nanoporos”, y la secuenciación por síntesis sigue siendo la dominante

    • Hay que cortar el genoma en fragmentos pequeños y luego volver a ensamblarlo con base en eso, y en ese proceso surgen varios problemas
    • La secuenciación por nanoporos tiene una tasa de error alta, así que en el entorno clínico se sigue usando la basada en síntesis (sobre todo Illumina, que ha destacado técnicamente en la última década)
    • Aun así, los equipos de nanoporos son pequeños y baratos, lo que los hace atractivos; la tasa de error se puede compensar hasta cierto punto con secuenciación repetida
    • Con tecnología basada en síntesis, si recurres a un proveedor confiable, se puede secuenciar un genoma completo con cobertura 30x por menos de 1000 euros o dólares; he visto ofertas de 180 dólares, pero no sé qué tan confiables sean
    • Para un genoma humano completo, nanoporos todavía parece prematuro, pero para usos como secuenciación de plásmidos ya es muy útil
      • Aunque no trabajo en la industria, en la universidad puedo dejar solo los tubos y recibir los resultados por correo a la mañana siguiente por 15 dólares, y todo esto es gracias a flujos de trabajo basados en nanoporos
    • La tasa de error puede compensarse con secuenciación repetida, pero a veces los errores también están correlacionados
    • En general, la secuenciación de lecturas cortas es mucho más costo-efectiva; en nuestra startup también hacemos QC de líneas celulares con Illumina y cuesta apenas 260 dólares
    • El método de secuenciación depende del objetivo; en NAO usamos flow cells grandes de Illumina (25B) para secuenciar barato y detectar distintos virus en aguas residuales
      • Pero cuando hay mucho virus objetivo, como en un hisopo nasal, nanoporos resulta más adecuado por la longitud de lectura y el bajo costo por corrida
    • La secuenciación clínica de lecturas cortas ya está lo suficientemente resuelta como para que nanoporos no tenga una razón clara para reemplazarla
    • El futuro en el entorno clínico está en detectar variantes medianas a grandes; esa área todavía no está bien aclarada, por eso nanoporos se usa mucho en investigación y en diagnóstico de enfermedades raras
    • SBS (secuenciación por síntesis) es muy confiable, pero que tenga tanta cuota de mercado no significa que el avance técnico se haya detenido
      • La innovación en secuenciación está ocurriendo en ML, análisis simultáneo de RNA-DNA, combinación de lecturas largas y cortas, etc.
    • De hecho, en los laboratorios de diagnóstico también se está usando cada vez más la tecnología de nanoporos; el costo de preparación es más bajo y la sensibilidad ya alcanza niveles de qPCR
      • Además ofrece más información, como metilación y otros datos
      • Incluso hay un artículo reciente sobre clasificación de leucemia aguda usando nanoporos texto completo del artículo
      • Aunque los tiempos están algo exagerados, lo importante para diagnóstico es que “funciona bien”
  • La idea (del artículo) me pareció interesante, pero me decepcionó un poco por los problemas del equipo y porque lo intentaron una vez y lo abandonaron enseguida

    • Dicen que el flow cell solo tenía 623 poros funcionando desde el inicio; me pregunto si eso también pasa normalmente, y quisiera encontrar más casos de intentos bien hechos
    • Yo también intenté algo parecido, pero usé saliva en lugar de sangre y extraje el DNA con un kit de Qiagen
      • En mi flow cell de nanoporos casi todos los poros funcionaban bien; supongo que en el caso del artículo el problema fue el método de almacenamiento
    • La cantidad de poros activos puede variar según cómo se manipule; por mi experiencia, la preparación de la muestra influye mucho en que aparezcan poros inactivos
      • Si la muestra no está bien preparada, los poros se tapan o baja su actividad
      • Hace tiempo analicé datos de Oxford Nanopore y la calidad cambiaba tanto según la habilidad en la preparación de muestras que incluso se podía distinguir qué colega la había preparado solo viendo los datos
      • Supongo que la calidad de las muestras preparadas en el “garaje” de los autores no era muy buena
      • Como referencia, incluso tuve un colega que armó un laboratorio de secuenciación móvil alimentado desde un auto
      • El mayor cuello de botella técnico que tuvo ese colega también fue la preparación de muestras; del lado computacional no era tan difícil
    • No diría que tener pocos poros activos sea “normal”, pero sí pasa con bastante frecuencia
      • En mi experiencia trabajando con NGS, una cuarta parte de todos los flow cells salía defectuosa, y ONT incluso tenía una política de reemplazo si el autotest de la celda fallaba
    • Depende de la muestra, pero normalmente es común tener más de 1200 poros activos, y al menos te garantizan 800
      • Así que en este caso valdría la pena pedir un reembolso
    • Este caso fue interesante porque mostró qué pasa “si uno realmente lo intenta”
      • Tengo un poco de experiencia en genealogía genética y ya esperaba que hubiera muchos problemas técnicos
  • Empresas como Nebula o Dante ofrecen secuenciación completa del genoma con cobertura 30x o 100x por alrededor de 300 dólares

    • En realidad, el genoma de 1000 dólares ya se había logrado hace 10 años
    • Revisé Nebula en su momento, pero está enfrentando una demanda colectiva por presuntamente haber compartido datos genómicos con Meta, Microsoft y Google
      • En Reddit también hay muchos casos de gente que envió el kit y no recibió resultados durante años
      • También hay problemas de calidad de secuenciación, tasas de falsos positivos en datos genómicos DTC (directo al consumidor), y como 23andMe tuvo algo parecido, me incomoda enviar mi genoma a una empresa privada
    • El precio más bajo de secuenciación completa del genoma en DanteLabs es de 399 euros (466 dólares) enlace al producto de DanteLabs
    • En los 2,000 dólares están incluidos el equipo de extracción de DNA y el secuenciador en sí; el secuenciador que usan servicios como Nebula probablemente sea una máquina de más de un millón de dólares
      • Si quieres algo más barato, en lugar de WGS también puedes hacer secuenciación de exoma o, según el caso, un simple análisis de genotipado
      • Puede que ya exista alguna empresa que haga WGS por 100 dólares
    • Pero al final, en esencia, eso significa que alguien (una empresa) termina teniendo propiedad sobre mis datos genómicos
      • Bajo la excusa de un interés legítimo pueden hacer prácticamente cualquier cosa, y el riesgo de que esa empresa sea hackeada o vendida ya se ha materializado antes
    • Los 1000 dólares son un “precio por economías de escala”
      • Es un rango de precio que solo se vuelve posible cuando procesas lotes lo bastante grandes
  • En mynucleus.com se puede hacer secuenciación completa del genoma por 500 dólares solo con un hisopo de mejilla (10% de descuento con el código savraj10)

    • No necesita sangre, entrega riesgo de más de 2,000 enfermedades, y si también se analiza la pareja incluso puede predecir futuros hijos
    • Pronto van a anunciar nuevas noticias de inversión, permiten descargar los datos crudos y garantizan cumplimiento de seguridad SOC2 y HIPAA
    • Por otro lado, me pregunto cómo podrían evitar que los datos genómicos terminen vendidos a terceros si Nucleus quiebra, como pasó con la filtración de datos personales en 23andMe
      • En su web no se ve muy clara la parte de diferenciación en privacidad de datos
      • Nucleus también dice que “no vende datos”, pero 23andMe decía lo mismo
      • La realidad es que, en el fondo, ninguna empresa puede dar confianza total en este punto
      • Entregarle tu genoma a Nucleus solo para ahorrar 3,000 dólares es algo que habría que pensar con mucho cuidado
    • Desde mi punto de vista, más que secuenciar mi genoma, lo que me pesa es depositar mi confianza en un tercero
      • La cobertura del 13% mencionada en el artículo no sirve para ningún análisis genómico útil; el título está exagerado
    • Me gustaría saber qué nivel de cobertura entregan
    • Me sorprende que un servicio que antes era carísimo o inaccesible para la mayoría ahora cueste 500 dólares
    • Me pregunto si aceptan Monero
  • Yo usé Nebula (ahora hicieron rebranding y se volvió más caro) para secuenciar también los genomas de mi familia, y fue bastante sencillo

    • Con el plan “Lifetime” guardé los archivos FASTQ en un bucket de R2; Nebula cuesta 250 dólares con una suscripción mensual de 50 dólares, pero se puede cancelar enseguida
    • Mi archivo VCF se puede ver aquí
      • Para una variante específica (rs104894396), puedes meterla en un LLM para analizarla o buscarla en SNPedia
    • De hecho, también hice carrier screening con mi esposa, pero por otro método distinto a Nebula
      • Confirmamos que ambos portamos un gen relacionado con pérdida auditiva asociado a GJB2, así que decidimos secuenciar también los embriones para poder tener un hijo sano
    • Si a alguien le da curiosidad ver una muestra de datos genómicos reales, puede usar mis datos como archivo de prueba (como soy hombre, también se pueden revisar variantes en chrY)
    • También probé Dante y quería comparar los resultados entre ambos servicios
      • Dante era incómodo porque manejaba de otra forma la vinculación entre la secuencia y el usuario (había que guardar un código aparte)
      • Nunca respondieron mis consultas, así que no supe bien cómo operaban
    • La tecnología de nanoporos también me parece realmente fascinante, aunque en Twitter vi comentarios sobre problemas de control de calidad del equipo
      • Algún día me gustaría compararla también con el genoma de mi hija
    • Como dato curioso, tú tienes CYP11B1 rs4541(g;a), así que quizá no te gustaba el regaliz
      • También tienes CYP17A1 −34 T>C, rs743572(A;G)
      • Dependiendo de la combinación genética completa, pueden aparecer distintos rasgos físicos o conductuales
      • Por ejemplo, podría haber tendencia a bajo peso, ansiedad, acné en la adolescencia, mareo ortostático, antojo de sal o trastornos del sueño
      • También puede haber tendencia a deficiencias de vitamina D, magnesio y vitaminas del grupo B, lo que puede derivar en distintos síntomas físicos o neurológicos (TMJ, calambres musculares, miopía, etc.)
      • Incluso se puede inferir afinidad por los juegos de estrategia de mesa, probabilidad de ser zurdo, inteligencia, patrones de sueño o talento visual a partir de ciertos genes
      • Pero una sola variante genética no puede explicar el conjunto completo, y siempre habría que ajustar dieta y estilo de vida consultándolo con un médico (yo no soy médico, solo soy programador y tengo como hobby profundizar en biología y genómica)
    • De verdad me da curiosidad por qué eres tan abierto a publicar todo tu DNA
  • Lamentablemente, el MinION Starter Kit de 1000 dólares ya no se vende, y el enlace del artículo ahora da 404

    • Ahora los productos MinION con flow cell empiezan desde 4,950 dólares
  • Si fuera a hacer secuenciación de DNA, jamás lo haría a menos que comprara el equipo y lo manejara yo mismo completamente offline

    • Eso implica un riesgo potencial no solo para mi información genómica, sino también para futuros descendientes y relaciones de parentesco
    • El peor escenario es más grave de lo que uno imagina
      • Además, la capacidad predictiva de salud es casi nula sin datos epigenéticos
      • Incluso podría perjudicar la salud por ansiedad o efecto nocebo
      • En la práctica, solo sirve como apoyo para confirmar un diagnóstico médico, y esa vía es más segura
  • Me dio risa el uso de una tetera eléctrica como sustituto de PCR (thermocycler)

    • Hubo una época en la que justo así se amplificaba DNA, alternando entre recipientes de agua caliente
    • Si hubieran extraído solo leucocitos de la sangre y secuenciado eso, probablemente el resultado habría sido mejor, pero con una lanceta y equipo mini no es tan fácil
      • A inicios de los 2010, en una práctica introductoria de biología, llegué a hacer PCR manual cambiando los tubos entre baños calientes y usando un temporizador de cocina
      • Después, cuando usé un thermocycler de verdad, valoré mucho más el equipo
  • Me gustaría ver datos posteriores a la gráfica (2001~2015) que mostraba que el costo de secuenciación caía más rápido que la ley de Moore

    • Solo encuentro gráficas que llegan hasta 2021, y parece que después de 2015 el avance más bien se frenó
    • Si nanoporos se vuelve más confiable, podría venir otra ola de cambio disruptivo
    • La gráfica empieza en 2001, pero yo participé a mediados de los 90 en EMBL en el desarrollo de secuenciadores por electroforesis en película delgada
      • En ese entonces, unas cuantas cientos de bases por día ya era lo máximo
    • Parece que NHGRI siguió actualizando esa gráfica, pero se detuvo después de 2022 por falta de fondos
      • Viéndolo bien, parece que en cinco años sí podría llegar la era del genoma de 100 dólares
  • Dante y Nebula no tienen muy buena reputación, y ySeq tiene una espera de 8 meses

    • El equipo de nanoporos del artículo tampoco funciona bien
    • En 2025, en Europa, no es nada fácil conseguir que secuencien mi genoma