Soy hahnlee, quien desarrolló hwp.js (https://github.com/hahnlee/hwp.js) :)
Cuando desarrollé ese proyecto, y aún ahora, la verdad es que no me gusta mucho HWP. Especialmente en cuanto a su nivel de apertura.
Sin embargo, hasta cierto punto sí coincido con la parte de que "el formato HWP tiene elementos favorables para el entrenamiento de IA".
Hablando desde mi experiencia al construir un RAG, en Corea se usan muchas tablas, en particular. En el caso de PDF, como es un formato pensado con la impresión en mente, no existen las "tablas" como tal dentro del PDF. Solo hay líneas y texto.
Por eso, extraer datos de información tabular compleja era difícil cuando se trabajaba con documentos PDF. Especialmente cuando una tabla se extendía a la página siguiente.
Dicho de forma aproximada, si HWP se siente como una especie de documento de texto enriquecido, PDF se sentía más como un documento txt. Claro, esto hablando solo de las "tablas".
Pero si la pregunta es si eso es una ventaja distintiva del formato HWP, yo diría que no. Para cosas simples, Markdown es suficiente, y si es algo más complejo, creo que es mejor definirlo en HTML.
Y, en definitiva, docx y odt también tienen la misma ventaja.
No me gusta HWP y no puedo hablar bien de los productos de la actual empresa Hancom, pero creo que en el pasado el producto en sí era un software mucho mejor que Word.
Para darle una respuesta precisa, incluso si es el mismo libro, si el formato es distinto hay que emitir un ISBN por separado. Incluso los ebooks en formato epub y pdf necesitan ISBN distintos.
Sobre lo que comentó la persona de arriba, en el caso de los ebooks en Corea, como se menciona en el texto, el concepto es comprar un “derecho de servicio”, así que es un poco diferente de poseer el contenido en sí. Además, cada librería aplica DRM distintos de manera diferente. Por eso, aunque pagué con mi dinero por un libro electrónico, no puedo usarlo cómodamente en cualquier entorno; hace falta una ley acorde con los tiempos. T_T
Personalmente, me gustaría que, como con MyData en el sector financiero, los materiales digitales también pudieran consumirse en la forma que yo quiera sin importar dónde los compre.
No entiendo por qué se necesita caché. En el enfoque clásico no hacía falta ninguna caché, y las situaciones en las que realmente hay que usarla son extremadamente limitadas, así que ¿por qué se juegan la vida innecesariamente con la caché?
Creo que el ataque de los políticos a la seguridad no es más ni menos que una actitud de “yo sí la voy a usar”. Si andan con varios asesores y aun así no pueden entender una tecnología de este nivel, eso ya es negligencia en el trabajo.
Aprendí a usar el procesador de texto con Han/Geul, pero ahora creo que es un vestigio que debería desaparecer por el bien del desarrollo de Corea del Sur.
En Rusia también reprimieron duro a Telegram, pero cuando toca hacer la guerra al final usan Telegram; y el gobierno de Corea también lo pintó como el eje del mal, pero luego se reveló que ellos mismos usaban Telegram, e incluso Signal. No existe en el mundo algo como una seguridad que solo me favorezca a mí, así que también da la impresión de que quizá les falta comprensión sobre la tecnología.
Se siente parecido a AlphaGo. No sabemos por qué hace una jugada así, pero la tasa de victoria es más alta de esa manera. Si logramos identificar bien los casos en que se distorsiona la esencia para que los humanos lo entiendan, eso podría ayudar muchísimo a optimizar.
Compararlo con flash 2 es difícil porque la diferencia de precio es demasiado grande... queda justo a medio camino entre o1pro y o3-mini
Soy hahnlee, quien desarrolló hwp.js (https://github.com/hahnlee/hwp.js) :)
Cuando desarrollé ese proyecto, y aún ahora, la verdad es que no me gusta mucho HWP. Especialmente en cuanto a su nivel de apertura.
Sin embargo, hasta cierto punto sí coincido con la parte de que "el formato HWP tiene elementos favorables para el entrenamiento de IA".
Hablando desde mi experiencia al construir un RAG, en Corea se usan muchas tablas, en particular. En el caso de PDF, como es un formato pensado con la impresión en mente, no existen las "tablas" como tal dentro del PDF. Solo hay líneas y texto.
Por eso, extraer datos de información tabular compleja era difícil cuando se trabajaba con documentos PDF. Especialmente cuando una tabla se extendía a la página siguiente.
Dicho de forma aproximada, si HWP se siente como una especie de documento de texto enriquecido, PDF se sentía más como un documento txt. Claro, esto hablando solo de las "tablas".
Pero si la pregunta es si eso es una ventaja distintiva del formato HWP, yo diría que no. Para cosas simples, Markdown es suficiente, y si es algo más complejo, creo que es mejor definirlo en HTML.
Y, en definitiva, docx y odt también tienen la misma ventaja.
Después de que Netscape quedó completamente aplastado por IE, soltaron el código fuente y demás, poniéndose a reaccionar tarde con mucho empeño.
No me gusta HWP y no puedo hablar bien de los productos de la actual empresa Hancom, pero creo que en el pasado el producto en sí era un software mucho mejor que Word.
Para darle una respuesta precisa, incluso si es el mismo libro, si el formato es distinto hay que emitir un ISBN por separado. Incluso los ebooks en formato epub y pdf necesitan ISBN distintos.
Sobre lo que comentó la persona de arriba, en el caso de los ebooks en Corea, como se menciona en el texto, el concepto es comprar un “derecho de servicio”, así que es un poco diferente de poseer el contenido en sí. Además, cada librería aplica DRM distintos de manera diferente. Por eso, aunque pagué con mi dinero por un libro electrónico, no puedo usarlo cómodamente en cualquier entorno; hace falta una ley acorde con los tiempos. T_T
Personalmente, me gustaría que, como con MyData en el sector financiero, los materiales digitales también pudieran consumirse en la forma que yo quiera sin importar dónde los compre.
Ajá... ya lo entiendo... jajajajaja
¿Qué es esto?
No entiendo por qué se necesita caché. En el enfoque clásico no hacía falta ninguna caché, y las situaciones en las que realmente hay que usarla son extremadamente limitadas, así que ¿por qué se juegan la vida innecesariamente con la caché?
Un ser desafortunado que no logró convertirse en un estándar mundial
Creo que el ataque de los políticos a la seguridad no es más ni menos que una actitud de “yo sí la voy a usar”. Si andan con varios asesores y aun así no pueden entender una tecnología de este nivel, eso ya es negligencia en el trabajo.
Aprendí a usar el procesador de texto con Han/Geul, pero ahora creo que es un vestigio que debería desaparecer por el bien del desarrollo de Corea del Sur.
En Rusia también reprimieron duro a Telegram, pero cuando toca hacer la guerra al final usan Telegram; y el gobierno de Corea también lo pintó como el eje del mal, pero luego se reveló que ellos mismos usaban Telegram, e incluso Signal. No existe en el mundo algo como una seguridad que solo me favorezca a mí, así que también da la impresión de que quizá les falta comprensión sobre la tecnología.
Yo también leí esa parte y me pareció extraña, pero cuando vi el dominio original lo entendí jajaja
"El formato HWP tiene elementos que son favorables para el entrenamiento de IA"
¿De verdad es cierto esto..?
La verdad, no me genera mucha identificación. Aunque bueno, si fuera
hwpx, como también se menciona en el texto...¡Jank, Jank~!
Vaya, es un manifiesto con muchísima energía jajaja. Está genial.
Se siente parecido a AlphaGo. No sabemos por qué hace una jugada así, pero la tasa de victoria es más alta de esa manera. Si logramos identificar bien los casos en que se distorsiona la esencia para que los humanos lo entiendan, eso podría ayudar muchísimo a optimizar.
Con
com0com, al conectar dos puertos seriales, es posible desarrollar y probar software de comunicación serial sin hardware adicional.Parece que también lo agregaron a Perplexity.
Pero al parecer todavía no se puede usar el razonamiento..