¿Cómo se podría refactorizar un "tipo de interruptor" para que sea polimórfico si no se controlan los tipos implicados?

Estoy escribiendo un analizador microformats en C# y estoy buscando algunos consejos de refactorización. Este es probablemente el primer proyecto "real" que he intentado en C# durante algún tiempo (programo casi exclusivamente en VB6 en mi trabajo diario), así que tengo la sensación de que esta pregunta puede convertirse en la primera de una serie ;-)¿Cómo se podría refactorizar un "tipo de interruptor" para que sea polimórfico si no se controlan los tipos implicados?

Permítanme proporcionar algunos antecedentes sobre lo que tengo hasta ahora, para que mi pregunta (con suerte) tenga sentido.

En este momento, tengo una sola clase, MicroformatsParser, haciendo todo el trabajo. Tiene un constructor sobrecargado que le permite pasar un System.Uri o un string que contiene un URI: al momento de la construcción, descarga el documento HTML en el URI dado y lo carga en un HtmlAgilityPack.HtmlDocument para una fácil manipulación por parte de la clase.

La API básica funciona así (o la voluntad, una vez que termine el código ...):

MicroformatsParser mp = new MicroformatsParser("http://microformats.org"); 
List<HCard> hcards = mp.GetAll<HCard>(); 

foreach(HCard hcard in hcards) 
{ 
    Console.WriteLine("Full Name: {0}", hcard.FullName); 

    foreach(string email in hcard.EmailAddresses) 
     Console.WriteLine("E-Mail Address: {0}", email); 
}

El uso de genéricos aquí es intencional. Me inspiré en la forma en que funciona la biblioteca Microformats en Firefox 3 (y la gema Ruby mofo). La idea aquí es que el analizador hace el trabajo pesado (encontrar el contenido real del microformato en el HTML), y las propias clases de microformato (HCard en el ejemplo anterior) básicamente proporcionan el esquema que le dice al analizador cómo manejar los datos que encuentra.

El código para la clase HCard debería hacer esto más claro (tenga en cuenta que este es un no una implementación completa):

[ContainerName("vcard")] 
public class HCard 
{ 
    [PropertyName("fn")] 
    public string FullName; 

    [PropertyName("email")] 
    public List<string> EmailAddresses; 

    [PropertyName("adr")] 
    public List<Address> Addresses; 

    public HCard() 
    { 
    } 
}

Los atributos aquí son utilizados por el programa de análisis para determinar cómo rellenar una instancia de la clase con datos de un documento HTML. El analizador hace lo siguiente cuando se llama GetAll<T>():

Comprueba que el tipo T tiene un atributo ContainerName (y no es blanco)
Búsquedas el documento HTML para todos los nodos con un atributo class que coincide con el ContainerName. Llámalos los "nodos del contenedor".
Para cada nodo contenedor:
- utiliza la reflexión para crear un objeto de tipo T.
- Obtener los campos públicos (un MemberInfo[]) para el tipo de T a través de la reflexión
- Para cada campo MemberInfo
  - Si el campo tiene un atributo PropertyName
    - Obtener el valor de la propiedad microformato correspondiente de la HTML
    - Inyecte el valor encontrado en el HTML en el campo (es decir,establecer el valor del campo en el objeto de tipo T creada en el primer paso)
    - Añadir el objeto de tipo T a un List<T>
- Volver al List<T>, que ahora contiene un montón de microformato objetos

estoy tratando de encontrar una mejor manera de poner en práctica el paso en negrita . El problema es que Type de un campo determinado en la clase de microformato no solo determina qué nodo buscar en el HTML, sino también cómo interpretar los datos.

Por ejemplo, volviendo a la clase HCard I definida anteriormente, la propiedad "email" está obligado a EmailAddresses el campo, que es un List<string>. Después de que el analizador encuentre todos los nodos secundarios "email" del nodo padre "vcard" en el HTML, tiene que ponerlos en un List<string>.

Lo que es más, si quiero que mi HCard para poder devolver la información del número de teléfono, probablemente me gustaría ser capaz de declarar un nuevo campo de tipo List<HCard.TelephoneNumber> (que tendría su propio atributo ContainerName("tel")) para mantener esa información, porque puede haber múltiples "tel" elementos en el HTML, y el formato "tel" tiene sus propias subpropiedades. Pero ahora el analizador necesita saber cómo poner los datos del teléfono en un List<HCard.TelephoneNumber>.

El mismo problema se aplica a Float S, DateTime S, List<Float> S, List<Integer> S, etc.

La respuesta obvia es tener el interruptor analizador del tipo de campo, y hacer las conversiones apropiadas para cada caso , pero quiero evitar una declaración switch gigante. Tenga en cuenta que no estoy planeando hacer que el analizador soporte todos los posibles Type existentes, pero querré que maneje la mayoría de los tipos escalares, y las versiones List<T> de ellos, junto con la capacidad de reconocer otras clases de microformato (para que un microformato la clase puede estar compuesta de otras clases de microformato).

¿Algún consejo sobre la mejor manera de manejar esto?

ya que el analizador tiene que manejar tipos de datos primitivos, no creo que pueda añadir polimorfismo en el nivel de tipo ...

Mi primera idea era utilizar la sobrecarga de métodos, por lo que tendría una serie de un GetPropValue se sobrecarga como GetPropValue(HtmlNode node, ref string retrievedValue), GetPropValue(HtmlNode, ref List<Float> retrievedValue), etc. pero me pregunto si hay un mejor enfoque para este problema.

Fuente

2009-02-16 Mike Spross

También podría intentar http://refactormycode.com/ –

El enfoque de Mehrdad es básicamente el que sugiero para empezar, pero como el primer paso de la posibilidad de más.

Se puede utilizar un simple IDictionary<Type,Delegate> (donde cada entrada es en realidad de T a Func<ParseContext,T> - pero eso no se puede expresar con los genéricos) para los tipos individuales (cadenas, primitivas, etc.), pero entonces también querrá comprobar si hay listas, mapas, etc. No podrá hacer esto usando el mapa, porque tendría que tener una entrada para cada tipo de lista (es decir, una entrada separada para List<string>, List<int>, etc.). Los genéricos hacen esto bastante complicado: si se complace en restringirse a solo ciertos tipos de concreto como List<T>, lo hará más fácil para usted (pero menos flexible). Por ejemplo, la detección de List<T> es sencillo:

if (type.IsGenericType && type.GetGenericTypeDefinition() == typeof(List<>)) 
{ 
    // Handle lists 
    // use type.GetGenericArguments() to work out the element type 
}

detectar si un tipo implementa IList<T> para algunos T (y luego descubrir T) puede ser un dolor, especialmente ya que podría haber múltiples implementaciones, y el propio tipo de hormigón pueden o puede no ser genérico Este esfuerzo podría valer la pena si realmente necesita una biblioteca muy flexible utilizada por miles de desarrolladores, pero de lo contrario lo mantendría simple.

Fuente

2009-02-16 07:16:32

+1. A propósito quería evitar lidiar con IList sabiendo que se complicaría rápidamente. A los fines de este proyecto, probablemente solo haga cumplir la noción de que si desea más de uno, debe ser una lista . –

Esto me hace pensar si el diseño general de la API es defectuoso. Tal vez me estoy acercando a todo desde el ángulo equivocado. OTOH, realmente me gusta la idea de poder definir nuevos microformatos con solo agregar atributos a una clase. Creo que "¿hay alguna forma diferente de hacer esto?" viene después :-) –

Aceptado. Fue un lanzamiento porque todas las respuestas aquí proporcionan buena información, pero esta proporciona (a) una buena sugerencia para una forma de implementar el requisito y (b) riesgos potenciales de ese enfoque. –

En lugar de una instrucción de cambio grande, puede construir un diccionario que asigne la cadena a un delegado y buscarla cuando desee analizar utilizando el método apropiado.

Fuente

2009-02-16 07:05:23

Este es un problema muy similar al que enfrenta mi motor de serialización (protobuf-net). Simplemente lo descompongo en conjuntos de lógica comunes: IList<T>, etc. (aunque hay una gran prueba de lógica/tipo para manejar las diversas primitivas). El enfoque que uso es: solo hágalo una vez ... construya un modelo basado en la interfaz/clase base que pueda manejar propiedades de diferentes tipos, y trabaje desde allí. Lo hago en el inicializador estático de una clase de caché genérica, es decir, Foo<T>; cuando T es HCard, precomputo un modelo (es decir, creo un objeto por propiedad que puede analizar/representar esa propiedad, y almacenarlos) que me permite procesar HCard sin pensar más adelante.

No digo que sea el mejor código del mundo, pero parece funcionar bien.

Fuente

2009-02-16 07:51:06

Suena interesante. Definitivamente voy a echar un vistazo a esto. –

¿Cómo se podría refactorizar un "tipo de interruptor" para que sea polimórfico si no se controlan los tipos implicados?

Respuesta

Cuestiones relacionadas