¿Cuántas de las 170 mil palabras en inglés conoces?
(vocabowl-870366514258.us-west1.run.app)- VocabOwl es una herramienta de Scientific Word Count que estima cuántas palabras conoce realmente una persona tomando como base 171,476 palabras en inglés
- Para ver el resultado hay que completar el desafío de 100 preguntas, un método que estima el tamaño total del vocabulario a partir de una prueba corta
- Indica que para construir las preguntas se usa muestreo estratificado (stratified sampling)
- El sitio destaca el uso de Gemini 3 Flash AI, incorporando IA en la generación y operación de la prueba de palabras
- Es un proyecto inspirado en el pódcast The Rest Is Science y en Prof. Hannah Fry y Michael Stevens
La prueba que ofrece VocabOwl
- VocabOwl es un servicio de estimación de vocabulario en inglés centrado en la pregunta: “How many of the 171,476 English words do you actually know?”
- La persona usuaria puede completar un desafío de 100 preguntas y comprobar cuántas palabras en inglés conoce
- Se indica que las preguntas de la prueba están construidas con un método scientifically stratified
Implementación y fuentes de inspiración
- En el sitio, Stratified Sampling aparece como el método principal
- La tecnología usada que se muestra es Gemini 3 Flash AI
- Como fuentes de inspiración se mencionan el pódcast The Rest Is Science, Prof. Hannah Fry y Michael Stevens
1 comentarios
Opiniones de Hacker News
Demasiados clics por cada palabra. Igual lo terminé porque me gustan este tipo de quizzes de “cuántas palabras conoces”, pero en general la clasificación me parece dudosa
Hay una tendencia general de palabras fáciles al principio y difíciles al final, pero la dificultad intermedia está bastante mezclada. breviary es mucho más rara de lo que sugeriría un nivel intermedio, y una palabra de fobia como Hippopotomonstrosesquippedaliophobia se siente menos como una palabra de uso real y más como una broma que un niño de primaria sacaría del diccionario para presumir. Tampoco convence poner metamorphosis y kinetic como nivel experto
Las definiciones en general eran reconocibles, pero poner lethargy como “estado de apatía” fue demasiado obvio, interpretar complacent como “autosatisfacción engreída” es excesivo, magnanimous no necesita necesariamente un “rival”, y gauche como solo “torpeza social” pierde el matiz de tactless
Dice ser “científico”, pero solo suelta una fórmula a grandes rasgos y no explica cómo estratificaron las palabras al principio. Si el muestreo estratificado es un método formalmente aceptado para algo así, me habría gustado ver enlaces a referencias reales. Creo que conozco muchas palabras, pero me cuesta creer la estimación de más de 75k que me dio esta app
Hippopotomonstrosesquippedaliophobia no parece una pregunta para que memorices la palabra completa, sino para inferir el significado a partir de sus componentes. Yo conocía sesquippedalian, phobia se reconoce fácil, y hasta hippo se puede intuir más como raíz latina de “grande” que como el animal
También he oído esos usos de complacent y gauche, y en un diccionario probablemente serían, como mínimo, la segunda o tercera definición, así que no me molesta. Antes me iba bien en concursos de ortografía, y si hubiera tenido la disciplina de estudiar diccionarios durante horas cada fin de semana, quizá habría subido más
Estaría mucho mejor si hubiera un resumen que mostrara cuáles de mis respuestas eran correctas y cuáles incorrectas
Aun así, ahí también analizan smug de forma parecida a self-satisfied o self-complacent, así que quizá lo que se siente raro sea el significado de smug. Para mí, smug no es simplemente algo de tipo “auto-”, sino algo relacional: disfrutar estar por encima de alguien. Complacent es, en lo básico, estar satisfecho con la propia situación, pero muchas veces lleva además la implicación negativa de que deberías actuar para mejorarla y no lo haces
Había demasiados clics por palabra, así que tomar la prueba llevaba mucho tiempo, y como incluso las palabras desconocidas venían con opciones, adivinar era demasiado fácil
El concepto es interesante, pero tener que responder 100 palabras es bastante. Pasar por las palabras fáciles del principio se vuelve aburrido, y me cansé antes de llegar a las interesantes
Un sistema así podría calibrarse mucho más rápido internamente usando una puntuación y un nivel de confianza. Al principio la confianza sería baja y luego iría subiendo; al comienzo, acertar o fallar movería la puntuación rápidamente, y después se estabilizaría
En la práctica, empezarías viendo palabras cada vez menos comunes, pero si fallas volverías a palabras más fáciles, y al volver a acertar terminarías orbitando cerca de tu nivel real. Además, también hay demasiados clics por palabra. Como es una prueba informal, bastaría con que al hacer clic en una definición se registrara de inmediato, y si preocupa un clic accidental, se podría poner un botón de deshacer
Estaría bien que cada opción tuviera una letra o número y pudiera seleccionarse con el teclado. Había un servicio de formularios que hacía algo así y funcionaba bastante bien; creo que era Typeform. Fui a revisar para confirmarlo, pero ahora está todo tan cubierto de menciones a AI que se me quitaron las ganas de comprobarlo
Además de las demás críticas, por un error estructural, el cálculo solo está bien a medias. Dependiendo de cómo se cuente, incluso podría decirse que está 100% mal.
Soy hablante nativo de inglés, un bicho raro que lee muchísimo y saqué puntaje perfecto en el SAT; acerté las 100 sin buscar nada. Aun así, la “SCIENTIFIC ESTIMATE” me mostraba que solo conocía 85,000 de 170,000, lo cual me confundió.
En la página final de “How is this calculated”, dice que, según la segunda edición del Oxford English Dictionary, hay unas 171,476 palabras de uso actual, y divide los rangos de dificultad en Core Basics 3,000, Intermediate 7,000, Advanced 10,000, Expert 25,000 y The Obscure 40,000+. La puntuación total supuestamente es la suma de la precisión por rango × el tamaño de cada rango.
Pero incluso sumando todos esos rangos, da 85,000, así que incluso con un puntaje perfecto solo llegas al 50%. Además, usa un subconjunto muy limitado del idioma que puede no representar bien la dificultad. Es simpático, pero está mal en varios sentidos.
Como suele pasar en pruebas de vocabulario en inglés, saber griego ayuda mucho en el nivel avanzado.
Sí hay algunas palabras técnicas, pero la mayoría son palabras que podrías oír en una conversación normal de Radio 4.
Me dio 78,000, que está bastante bien para ser mi segundo idioma. Parece que el valor máximo de esta prueba es 85,000.
Las opciones parecen generadas por un LLM, y hay algunos patrones, como que “now” y “forever” aparecen seguido.
Hace unos años jugué algo parecido, donde podías seguir jugando indefinidamente: si acertabas suficientes seguidas, subías de nivel, y si fallabas una, bajabas. En los niveles muy altos hasta se volvía más fácil, porque empezaban a aparecer palabras del inglés antiguo y esas eran prácticamente iguales a palabras de mi lengua materna, el neerlandés. Creo que además tenía un componente benéfico y probablemente era https://freerice.com/, aunque ahora parece que simplificaron el juego.
La Ghent University, en Bélgica, también tenía una prueba interesante, y evaluaba el nivel comparándolo con el puntaje promedio de cierto nivel educativo. Ahí saqué como 41,000, y creo que me evaluó como el promedio de un hablante nativo universitario de inglés. En la actualización al final de https://languagehat.com/ghent-vocabulary-test/ dice adónde fue a parar esa prueba y menciona algunas alternativas.
Está bastante divertido.
Estaría bueno quitar el botón de enviar y que, al tocar una respuesta, te diga si acertaste y después de un segundo pase a la siguiente. Tener que presionar enviar dos veces rompe la inmersión.
Además, en las palabras que vi, una de las 4 opciones era la correcta, una era el antónimo de la correcta y las otras dos eran casi aleatorias. En la práctica, si una opción no venía acompañada por su antónimo, podías descartarla.
Para empezar, se podían descartar las respuestas que descomponían la palabra en palabras comunes del inglés. Si una palabra pudiera descomponerse tan fácil, difícilmente sería obscure desde el principio.
Es difícil escribir distractores para preguntas de opción múltiple. De los exámenes que conozco, salvo los que piden cálculo o memorización, el LEK, el examen nacional de medicina para doctores en Polonia, lo hace casi con crueldad. Es casi imposible que alguien fuera del área saque más que el azar adivinando por intuición.
Debería poder responderse con “No sé”. Cuando de verdad no sabes, acertar por casualidad con probabilidad de 1/4 es injusto, y usando estrategias típicas de opción múltiple incluso puedes acertar más que eso.
Hubo varias palabras en las que con gusto habría aceptado que me las contaran como mal, pero igual terminaron sumándome como correctas.
También deberían mezclar un poco la dificultad. Las últimas 30 se sintieron como trabajo tedioso. La idea en sí está buena.
Incluso en el peor caso, se puede corregir esa probabilidad del 25% de acertar por casualidad.
Se puede pasar con maña con bastante facilidad. Muchas opciones no parecen definiciones de palabras, se repite mucho la estructura de “respuesta correcta + significado opuesto + 2 irrelevantes”, y en la parte final la respuesta más larga era correctísima demasiadas veces. El diseño de los distractores no es bueno.
La muestra de palabras también está muy sesgada hacia conceptos relacionados con palabras, habla, hablantes y persuasión. Probablemente un LLM recibió un prompt para elegir palabras y terminó seleccionando términos relacionados con “palabras”.
Como contexto: soy hablante de segundo idioma, fanático de la lingüística y uso el inglés sobre todo en entornos académicos y profesionales. Combinando esos trucos me dio 75,400, pero en realidad quizá esté más cerca de 10–15k.
El diseño también es, como cualquiera puede notar, dolorosamente parecido a Duolingo.
Creo que casi todo el mundo con cierta edad coincidirá en que la mayoría de los idiomas tienen alguna palabra para ese tipo de dolor.
Acerté 88 de 100, pero lo único que aprendí de eso es que se me da bastante bien adivinar. Como 20 pude responderlas eliminando opciones poco plausibles o deduciéndolas por el significado de partes de la palabra.
Si hubiera una opción de “No sé”, serviría para evaluar de forma más honesta cuántas palabras realmente conozco y cuántas simplemente logro acertar.
Para encontrar el nivel más rápido, habría que usar una calificación ELO. No tiene sentido batallar con 100 palabras básicas
Están usando de forma imprecisa la cifra de 171,476 del OED, y el enfoque malinterpreta gravemente tanto al diccionario como al idioma
Esa cifra se refiere al número de entradas completas definidas como de “current use” en la Second Edition de 20 volúmenes del Oxford English Dictionary. No significa la cantidad de palabras. Tampoco incluye todas las variantes ortográficas, formas flexionadas, frases ni entradas run-on del OED
Además, el OED no es en absoluto una lista completa del inglés. De hecho, como su ciclo de actualización es muy lento, es muy probable que falten cientos de miles de palabras. Como editor de diccionarios y lexicógrafo, uso el OED todos los días, y quienes lo elaboran también lo saben