1 puntos por GN⁺ 6 시간 전 | 1 comentarios | Compartir por WhatsApp
  • VocabOwl es una herramienta de Scientific Word Count que estima cuántas palabras conoce realmente una persona tomando como base 171,476 palabras en inglés
  • Para ver el resultado hay que completar el desafío de 100 preguntas, un método que estima el tamaño total del vocabulario a partir de una prueba corta
  • Indica que para construir las preguntas se usa muestreo estratificado (stratified sampling)
  • El sitio destaca el uso de Gemini 3 Flash AI, incorporando IA en la generación y operación de la prueba de palabras
  • Es un proyecto inspirado en el pódcast The Rest Is Science y en Prof. Hannah Fry y Michael Stevens

La prueba que ofrece VocabOwl

  • VocabOwl es un servicio de estimación de vocabulario en inglés centrado en la pregunta: “How many of the 171,476 English words do you actually know?”
  • La persona usuaria puede completar un desafío de 100 preguntas y comprobar cuántas palabras en inglés conoce
  • Se indica que las preguntas de la prueba están construidas con un método scientifically stratified

Implementación y fuentes de inspiración

  • En el sitio, Stratified Sampling aparece como el método principal
  • La tecnología usada que se muestra es Gemini 3 Flash AI
  • Como fuentes de inspiración se mencionan el pódcast The Rest Is Science, Prof. Hannah Fry y Michael Stevens

1 comentarios

 
GN⁺ 6 시간 전
Opiniones de Hacker News
  • Demasiados clics por cada palabra. Igual lo terminé porque me gustan este tipo de quizzes de “cuántas palabras conoces”, pero en general la clasificación me parece dudosa
    Hay una tendencia general de palabras fáciles al principio y difíciles al final, pero la dificultad intermedia está bastante mezclada. breviary es mucho más rara de lo que sugeriría un nivel intermedio, y una palabra de fobia como Hippopotomonstrosesquippedaliophobia se siente menos como una palabra de uso real y más como una broma que un niño de primaria sacaría del diccionario para presumir. Tampoco convence poner metamorphosis y kinetic como nivel experto
    Las definiciones en general eran reconocibles, pero poner lethargy como “estado de apatía” fue demasiado obvio, interpretar complacent como “autosatisfacción engreída” es excesivo, magnanimous no necesita necesariamente un “rival”, y gauche como solo “torpeza social” pierde el matiz de tactless
    Dice ser “científico”, pero solo suelta una fórmula a grandes rasgos y no explica cómo estratificaron las palabras al principio. Si el muestreo estratificado es un método formalmente aceptado para algo así, me habría gustado ver enlaces a referencias reales. Creo que conozco muchas palabras, pero me cuesta creer la estimación de más de 75k que me dio esta app

    • A mí algunas sí me parecieron razonables. breviary me resultó familiar y no particularmente rara. Es bastante conocida entre católicos, y si te interesa el arte medieval o los libros, hay buenas probabilidades de que la conozcas. Era uno de los principales tipos de libros antes de la imprenta, así que si piensas en imágenes de manuscritos iluminados, quizá la mitad venga de ahí
      Hippopotomonstrosesquippedaliophobia no parece una pregunta para que memorices la palabra completa, sino para inferir el significado a partir de sus componentes. Yo conocía sesquippedalian, phobia se reconoce fácil, y hasta hippo se puede intuir más como raíz latina de “grande” que como el animal
      También he oído esos usos de complacent y gauche, y en un diccionario probablemente serían, como mínimo, la segunda o tercera definición, así que no me molesta. Antes me iba bien en concursos de ortografía, y si hubiera tenido la disciplina de estudiar diccionarios durante horas cada fin de semana, quizá habría subido más
    • Una de las últimas palabras fue kerfuffle, que me parece bastante común. En cambio, nunca había oído Zenzizenzizenzic, aunque creo que la acerté
      Estaría mucho mejor si hubiera un resumen que mostrara cuáles de mis respuestas eran correctas y cuáles incorrectas
    • Coincido en que complacent no parece esencialmente smug, pero curiosamente tanto dictionary.com como Wiktionary incluyen smug como sinónimo o parte de la definición
      Aun así, ahí también analizan smug de forma parecida a self-satisfied o self-complacent, así que quizá lo que se siente raro sea el significado de smug. Para mí, smug no es simplemente algo de tipo “auto-”, sino algo relacional: disfrutar estar por encima de alguien. Complacent es, en lo básico, estar satisfecho con la propia situación, pero muchas veces lleva además la implicación negativa de que deberías actuar para mejorarla y no lo haces
    • Me impresiona que haya llegado a la portada de HN aunque casi no parece una prueba adaptativa
    • Aunque no conozcas Hippopotomonstrosesquippedaliophobia, entre cuatro opciones es facilísimo acertarla
      Había demasiados clics por palabra, así que tomar la prueba llevaba mucho tiempo, y como incluso las palabras desconocidas venían con opciones, adivinar era demasiado fácil
  • El concepto es interesante, pero tener que responder 100 palabras es bastante. Pasar por las palabras fáciles del principio se vuelve aburrido, y me cansé antes de llegar a las interesantes
    Un sistema así podría calibrarse mucho más rápido internamente usando una puntuación y un nivel de confianza. Al principio la confianza sería baja y luego iría subiendo; al comienzo, acertar o fallar movería la puntuación rápidamente, y después se estabilizaría
    En la práctica, empezarías viendo palabras cada vez menos comunes, pero si fallas volverías a palabras más fáciles, y al volver a acertar terminarías orbitando cerca de tu nivel real. Además, también hay demasiados clics por palabra. Como es una prueba informal, bastaría con que al hacer clic en una definición se registrara de inmediato, y si preocupa un clic accidental, se podría poner un botón de deshacer

    • Hay que asumir que también habrá errores de entrada y meter eso en el cálculo de confianza. Hasta la persona más inteligente del mundo a veces comete un error mecánico simple o se le dispara una neurona equivocada por un instante
    • En especial, coincido con la primera crítica. Hice unas 10 palabras y abandoné porque no estaba claro cómo avanzar a la siguiente etapa
    • Tampoco llega a ponerse lo suficientemente difícil. Además, demasiadas palabras eran sobre palabras largas en sí mismas o sobre la tendencia a hablar de manera rebuscada
    • En móvil, el botón de enviar queda abajo de la pantalla, así que hay que desplazarse. Una vez que haces scroll una vez, parece quedar en una posición aceptable
    • Los elementos clicables también están demasiado separados. En laptop tenía que mover el cursor arriba y abajo constantemente para elegir una respuesta y luego confirmarla
      Estaría bien que cada opción tuviera una letra o número y pudiera seleccionarse con el teclado. Había un servicio de formularios que hacía algo así y funcionaba bastante bien; creo que era Typeform. Fui a revisar para confirmarlo, pero ahora está todo tan cubierto de menciones a AI que se me quitaron las ganas de comprobarlo
  • Además de las demás críticas, por un error estructural, el cálculo solo está bien a medias. Dependiendo de cómo se cuente, incluso podría decirse que está 100% mal.
    Soy hablante nativo de inglés, un bicho raro que lee muchísimo y saqué puntaje perfecto en el SAT; acerté las 100 sin buscar nada. Aun así, la “SCIENTIFIC ESTIMATE” me mostraba que solo conocía 85,000 de 170,000, lo cual me confundió.
    En la página final de “How is this calculated”, dice que, según la segunda edición del Oxford English Dictionary, hay unas 171,476 palabras de uso actual, y divide los rangos de dificultad en Core Basics 3,000, Intermediate 7,000, Advanced 10,000, Expert 25,000 y The Obscure 40,000+. La puntuación total supuestamente es la suma de la precisión por rango × el tamaño de cada rango.
    Pero incluso sumando todos esos rangos, da 85,000, así que incluso con un puntaje perfecto solo llegas al 50%. Además, usa un subconjunto muy limitado del idioma que puede no representar bien la dificultad. Es simpático, pero está mal en varios sentidos.

    • Exactamente la misma observación. Acerté las 100 y me dio el mismo resultado.
      Como suele pasar en pruebas de vocabulario en inglés, saber griego ayuda mucho en el nivel avanzado.
    • La selección de “palabras avanzadas” está medio rara. obscure no es tan obscure.
      Sí hay algunas palabras técnicas, pero la mayoría son palabras que podrías oír en una conversación normal de Radio 4.
    • En bastantes casos se podía acertar porque 3 de las 4 opciones claramente no tenían sentido. Si la meta fuera una estimación real, preferiría que hubiera un botón de “No sé” en vez de simplemente obligarte a elegir la correcta.
    • Claramente parece hecho con IA.
    • Saqué unas 80 correctas y me dio 57k.
  • Me dio 78,000, que está bastante bien para ser mi segundo idioma. Parece que el valor máximo de esta prueba es 85,000.
    Las opciones parecen generadas por un LLM, y hay algunos patrones, como que “now” y “forever” aparecen seguido.
    Hace unos años jugué algo parecido, donde podías seguir jugando indefinidamente: si acertabas suficientes seguidas, subías de nivel, y si fallabas una, bajabas. En los niveles muy altos hasta se volvía más fácil, porque empezaban a aparecer palabras del inglés antiguo y esas eran prácticamente iguales a palabras de mi lengua materna, el neerlandés. Creo que además tenía un componente benéfico y probablemente era https://freerice.com/, aunque ahora parece que simplificaron el juego.
    La Ghent University, en Bélgica, también tenía una prueba interesante, y evaluaba el nivel comparándolo con el puntaje promedio de cierto nivel educativo. Ahí saqué como 41,000, y creo que me evaluó como el promedio de un hablante nativo universitario de inglés. En la actualización al final de https://languagehat.com/ghent-vocabulary-test/ dice adónde fue a parar esa prueba y menciona algunas alternativas.

  • Está bastante divertido.
    Estaría bueno quitar el botón de enviar y que, al tocar una respuesta, te diga si acertaste y después de un segundo pase a la siguiente. Tener que presionar enviar dos veces rompe la inmersión.
    Además, en las palabras que vi, una de las 4 opciones era la correcta, una era el antónimo de la correcta y las otras dos eran casi aleatorias. En la práctica, si una opción no venía acompañada por su antónimo, podías descartarla.

    • Si hubiera atajos de teclado, resolver 100 palabras sería mucho menos incómodo. 1–4 para elegir opción, Enter para enviar, y también habría que arreglar el problema de que el diseño salta de lugar.
    • Me estimó en 74k, pero siento que puede estar inflado. Muchas veces, aunque no supieras la respuesta, podías inferirla por el tono de las opciones, y los distractores no eran lo bastante plausibles.
      Para empezar, se podían descartar las respuestas que descomponían la palabra en palabras comunes del inglés. Si una palabra pudiera descomponerse tan fácil, difícilmente sería obscure desde el principio.
      Es difícil escribir distractores para preguntas de opción múltiple. De los exámenes que conozco, salvo los que piden cálculo o memorización, el LEK, el examen nacional de medicina para doctores en Polonia, lo hace casi con crueldad. Es casi imposible que alguien fuera del área saque más que el azar adivinando por intuición.
    • Me molestaría muchísimo que te marcaran una respuesta como incorrecta no por haber elegido mal, sino por tocar accidentalmente la pantalla del celular.
  • Debería poder responderse con “No sé”. Cuando de verdad no sabes, acertar por casualidad con probabilidad de 1/4 es injusto, y usando estrategias típicas de opción múltiple incluso puedes acertar más que eso.
    Hubo varias palabras en las que con gusto habría aceptado que me las contaran como mal, pero igual terminaron sumándome como correctas.

    • Resolví las 100, y ni siquiera es 1/4. En las palabras difíciles, si una explicación era mucho más larga que las otras, muchas veces esa era la correcta. Además, dos de las opciones solían ser algún tipo de objeto, y casi nunca parecían ser la respuesta correcta.
      También deberían mezclar un poco la dificultad. Las últimas 30 se sintieron como trabajo tedioso. La idea en sí está buena.
    • Sería más fácil y rápido si para cada palabra solo te preguntaran con sí/no si conoces la definición. Así podrías recorrer rápido incluso 100. También estaría bien que cada opción tuviera atajos de teclado.
    • En algunos casos inferí la definición correcta comparando las opciones.
    • Tal vez obligarte a adivinar sí tenga más sentido, porque puedes basarte en componentes de palabras que sí conoces.
      Incluso en el peor caso, se puede corregir esa probabilidad del 25% de acertar por casualidad.
  • Se puede pasar con maña con bastante facilidad. Muchas opciones no parecen definiciones de palabras, se repite mucho la estructura de “respuesta correcta + significado opuesto + 2 irrelevantes”, y en la parte final la respuesta más larga era correctísima demasiadas veces. El diseño de los distractores no es bueno.
    La muestra de palabras también está muy sesgada hacia conceptos relacionados con palabras, habla, hablantes y persuasión. Probablemente un LLM recibió un prompt para elegir palabras y terminó seleccionando términos relacionados con “palabras”.
    Como contexto: soy hablante de segundo idioma, fanático de la lingüística y uso el inglés sobre todo en entornos académicos y profesionales. Combinando esos trucos me dio 75,400, pero en realidad quizá esté más cerca de 10–15k.
    El diseño también es, como cualquiera puede notar, dolorosamente parecido a Duolingo.

    • Tuve que buscar la palabra inglesa lumbago por una definición como “dolor agudo en la espalda”. En alemán existe la expresión mucho más pintoresca Hexenschuss.
      Creo que casi todo el mundo con cierta edad coincidirá en que la mayoría de los idiomas tienen alguna palabra para ese tipo de dolor.
    • Todas las opciones que incluían punto y coma eran correctas.
    • Desde la página de inicio ya se notaba que era como Duolingo.
  • Acerté 88 de 100, pero lo único que aprendí de eso es que se me da bastante bien adivinar. Como 20 pude responderlas eliminando opciones poco plausibles o deduciéndolas por el significado de partes de la palabra.
    Si hubiera una opción de “No sé”, serviría para evaluar de forma más honesta cuántas palabras realmente conozco y cuántas simplemente logro acertar.

  • Para encontrar el nivel más rápido, habría que usar una calificación ELO. No tiene sentido batallar con 100 palabras básicas

  • Están usando de forma imprecisa la cifra de 171,476 del OED, y el enfoque malinterpreta gravemente tanto al diccionario como al idioma
    Esa cifra se refiere al número de entradas completas definidas como de “current use” en la Second Edition de 20 volúmenes del Oxford English Dictionary. No significa la cantidad de palabras. Tampoco incluye todas las variantes ortográficas, formas flexionadas, frases ni entradas run-on del OED
    Además, el OED no es en absoluto una lista completa del inglés. De hecho, como su ciclo de actualización es muy lento, es muy probable que falten cientos de miles de palabras. Como editor de diccionarios y lexicógrafo, uso el OED todos los días, y quienes lo elaboran también lo saben