-1

Tengo un archivo con extensión HTML que contiene errores. En vez de estar las palabras escritas correctamente aparece esto: �.

El archivo me llega así y no es posible arreglarlo desde el origen. Por eso, estoy buscando otras soluciones.

Edito: Puedo acceder al contenido del archivo.

¿Alguna sugerencia?

Geline
  • 9
  • 7
  • Saludos. Ya que "no es una solución arreglarlo desde el origen"; abrelo en un editor de texto y sabiendo la palabra que esta mal escrita usa la opción **reemplazar** para cambiar ya sea la letra/símbolo que sale mal por el correcto. Lo siguiente no lo he realizado, pero mira al inicio si tiene `utf-8` y lo cambias por `ISO-8859-1` o viceversa. – RobertoLeOr Jul 05 '20 at 19:08
  • @RobertoLeOr Hola, el archivo es muy extenso y contiene muchos errores. Además son varios archivos, reemplazarlo individualmente se convertiría en una ardua tarea. Por ello busco una forma de 'corregirlo' con código y así automatizarlo. La segunda opción que propones no me da resultado, ¿puede que sea porque el archivo está así desde el inicio? – Geline Jul 05 '20 at 19:24
  • 1
    ¿Responde esto a tu pregunta? [¿Por que el Carácter inspector (�) aparece en algunos datos obtenidos de la Base de Datos?](https://es.stackoverflow.com/questions/59489/por-que-el-car%c3%a1cter-inspector-aparece-en-algunos-datos-obtenidos-de-la-base) – BetaM Jul 05 '20 at 19:31
  • @BetaM El archivo lo tengo tal cual con ese carácter, no me llega de base de datos, es estático. Gracias de todas formas – Geline Jul 05 '20 at 19:44
  • Entonces si no hay acceso al archivo será prácticamente imposible y la pregunta será cerrada como un problema que no se puede reproducir – BetaM Jul 05 '20 at 19:47
  • Puedo acceder al archivo y a su contenido. Me refiero que no lo obtengo de base de datos si se modifica/actualiza. Estoy buscando coger cada palabra y compararlas con un diccionario (o algo así) y la que tenga error, modificarla. O si hay un sistema de 'completado' que detecte la letra que falta. Igual es imposible como me dices y le estoy dando demasiadas vueltas. – Geline Jul 05 '20 at 19:54
  • Que te digo deberías indicar algún intento por qué así como lo mencionas también es motivo de cierre por ser basada en opiniones – BetaM Jul 05 '20 at 19:59
  • @BetaM ¿Qué quieres decir?, ¿cómo debería plantear la pregunta? – Geline Jul 05 '20 at 20:12
  • Con base a [ask], mostrando no solo el problema sino además que has intentado – BetaM Jul 05 '20 at 20:13
  • Eso lo tengo claro pero no he intentado nada porque no sé que hacer, por eso la pregunta. Lo que he probado ha sido después de lo que han comentado aquí. – Geline Jul 05 '20 at 20:18
  • que sistema operativo tenes ? en linux podés probar con [`iconv`](https://linux.die.net/man/1/iconv). que lenguajes hay disponibles para hacer un batch? bash, php, python, ruby ? – alo Malbarez Jul 05 '20 at 21:51
  • 1
    Trabajo con Windows 10. Estoy empezando en el mundo de desarrollo así que todo es bastante nuevo para mí. – Geline Jul 06 '20 at 16:01
  • [gnuwin32](http://gnuwin32.sourceforge.net/packages/libiconv.htm) viene con una implementación de iconv para windows, probalo con un par de archivos a ver si sirve y si se te complica armar el batch para procesar todos ya tenes material para editar la pregunta – alo Malbarez Jul 06 '20 at 19:37

1 Answers1

-1

generalmente esto pasa cuando una palabra tiene tilde o en la ñ, si no quieres utilizar utf iso intenta con esto.

 á -> á
 é -> é
 í -> í
 ó -> ó
 ú -> ú
 ñ -> ñ

ejemplo

    <h1>a&ntildeadir</h1>

o también puedes añadir el utf o iso

<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />
<meta http-equiv=”Content-Type” content=”text/html; charset=ISO-8859-1″ />
daniel
  • 1
  • 2