Sí, HTML5 tendrá características (incluso elementos/etiquetas) que XHTML aún no posee. También reintroducirá algunas etiquetas de HTML4 que se eliminaron para XHTML. (Iframe, es uno de ellos, creo)
Si usted quiere saber acerca de las diferencias entre HTML 4/XHTML y HTML 5, leer la entrada de Wikipedia sobre HTML 5: http://en.wikipedia.org/wiki/HTML_5#Differences_from_HTML_4.01.2FXHTML_1.x
Sin embargo, no, XHTML no es igual a HTML a los efectos de la representación. http://hixie.ch/advocacy/xhtml
XHTML es más XML que HTML. Utiliza esencialmente (la mayoría de) los elementos ('etiquetas') de HTML respetando la gramática más estricta y la semántica de XML.
Es no igual a HTML4 con el fin de renderizar. Si utiliza un tipo de MIME de XHTML - ya que es XML - se puede terminar con errores de análisis desagradables si lo haces mal:
... pero a pesar de este problema utilizando XHTML puede dar lugar a más comportamiento consistente entre navegadores que HTML4; dado que HTML4 no es tan estricto, los navegadores intentan interpretar el marcado ambiguo, y los desarrolladores del navegador terminan con cierta libertad para elegir cómo se tratan estas ambigüedades. Esto conduce a inconsistencias, pero con XHTML - que es XML - se supone que el navegador se niega a mostrar la página en todo si es ambiguo.
XHTML puede conducir a problemas con los navegadores más antiguos, sin embargo, especialmente con los elementos vacíos (etiquetas auto-cierre) como <br />
; un navegador antiguo no sabrá qué hacer con el /
y podría pensar que forma parte del nombre de la etiqueta y luego perderá el salto de línea.
Por último, no sé a qué te refieres con "Convertir de texto/html a application/xhtml + xml es difícil porque no es HTML", pero te animo a que revises el libro "Refactoring HTML" by Elliotte Rusty Harold ... parece ser una respuesta de 300 páginas a la pregunta;)
Los navegadores no tienen la libertad de inventar sus propias reglas sobre cómo analizar HTML (más). Ahora que HTML5 define el algoritmo de análisis correcto. – Ms2ger
Los navegadores nunca tienen la libertad de inventar sus propias reglas sobre cómo analizar HTML; solo cómo manejar los errores. – Quentin
@ ms2ger - Buen punto; Debería haber usado el término "HTML4" en lugar de solo "HTML" en ese párrafo después de la imagen. Lo estoy editando ahora :) –