2011-09-14 22 views
7

Estoy diseñando una base de datos para una aplicación de bienes raíces. Está demostrando ser más complicado de lo que había anticipado (tal vez estoy complicando las cosas).¿Cómo diseño una base de datos para almacenar propiedades, seleccionando atributos por sinónimos?

Los problemas esencialmente se deben a la presencia de:

  • sinónimos Por ejemplo, los términos: piso, apartamento y ático pueden todos se refieren a esencialmente, el mismo tipo de propiedad
  • atributos (propiedad diferente tipos tienen diferentes atributos) Por ejemplo un apartamento podría ser una planta baja o planta superior etc

he terminado con un lugar (no) elaborada classifica árbol de decisión para diferentes tipos de propiedad. Los nodos de árbol son las instancias reales de los tipos de propiedad.

Quiero crear una base de datos para que pueda consultar utilizando no solo ninguno de los sinónimos, sino también los atributos.

Así, por ejemplo, la consulta (en seudo SQL):

SELECT * de propiedades donde sinónimo = "plana" y atribuir IN ('planta baja', 'jardín');

debe devolver una lista de apartamentos | pisos que son planta baja Y tienen un jardín.

¿Alguien me puede ayudar con la forma de diseñar el esquema de la base de datos para permitir el tipo de consultas descrito anteriormente?

Por último, pero no menos importante, utilizaré MySQl o PostgreSQL como base de datos back-end, pero preferiría que el enfoque sea db agnostic, si es posible.

+1

"... Apartamento, apartamento y ático pueden referirse esencialmente, el mismo tipo de propiedad" Y no pueden. Si estoy buscando un ático, no quiero ver un apartamento. (Probablemente) –

+0

"cualquiera planta baja Y tener un jardín". no tiene sentido, tampoco ¿qué? – reggaeguitar

Respuesta

1

Para manejar sinónimos, puede tener una búsqueda de muchos a muchos entre una tabla que contiene la lista estática de sus tipos de propiedad, y una tabla que contiene el sinónimo. De esta forma, un sinónimo podría asignarse a más de un tipo de propiedad.

Por ejemplo:

Table:Property Type 
1 House 
2 Appartment 
3 Large House 
4 Cave 

Table:Synonym 
1 house 
2 flat 
3 dwelling 
4 condo 
5 mansion 

Table:PropertyType-Synonym 
1 1 (House is a house 
1 3 (House is a dwelling) 
2 2 (Appartment is a flat) 
2 3 (Appartment is a dwelling) 
2 4 (Appartment is a condo) 
3 1 (Large House is a house) 
3 3 (Large House is a dwelling) 
3 5 (Large House is a mansion) 
4 3 (Cave is a dwelling) 

Para las propiedades, se podría utilizar un tipo de estructura de atributos abierta.

Por ejemplo:

Table:Property 
1 Apartment F, Field House Gardens 
2 123 Alphabet Street, NumberTown 

Table:Attribute 
1 Is ground floor? 
2 Number of bedrooms 
3 Has garden? 

Table:Property-Attribute-Values 
1 1 No 
1 2 2 
1 3 Yes 
2 2 5 
2 3 Yes 

Esperanza esto ayuda

23

que sería adoptar un enfoque diferente a su esquema de atribución. En lugar de tratar diferentes atribuciones como sinónimos, las trataría como superposiciones, o más específicamente, anidadas descripciones de una propiedad. Esto manejaría su caso comercial al mismo tiempo que reconoce la astuta observación hecha por Mike Sherrill.

Aquí es un rápido esbozo ERD:

ERD

A modo de un diccionario de datos muy rápido:

PROPERTY es un pedazo de bienes raíces.

CATEGORY es una colección de atributos descriptivos. El objetivo de esta tabla es más como un organizador de atributos que cualquier otra cosa. Podría incluir cosas como "tipo de propiedad", "estructura de propiedad", "cantidad de baños" y cualquier otra cosa que pueda ser de su interés.

ATTRIBUTE es una cualidad de interés específica. Tenga en cuenta la relación involucionada en este tipo de entidad. Trataré más con eso más tarde. El punto principal es que los atributos pueden ser más generales o más específicos y algunos atributos se pueden ver como refinamientos de otros atributos.

DESCRIPTOR es la intersección de una PROPIEDAD y los ATRIBUTOS que se han asociado con esa propiedad en particular.

Entonces, ¿cómo se supone que esto ayuda?

La clave es cómo funcionan los atributos. Si usa un modelo anidado modelo, puede abordar los criterios de atribución y búsqueda más o menos específicos. Considere el siguiente diagrama de una categoría potencial con sus atributos asociados:

enter image description here

En este ejemplo, la categoría es "tipo de propiedad". Puede ver en el diagrama que hay un desglose jerárquico de atributos en esta categoría. Cada cuadro en el diagrama es un registro en ATRIBUTO. Los cuadros que contienen otros cuadros tienen atributos secundarios. Las cajas que están dentro de otra caja tienen un FK en su caja contenedora y así sucesivamente.

De esta manera, podría decir "Quiero encontrar una propiedad que sea un Penthouse". A continuación, puede encontrar los registros de PROPIEDAD con un DESCRIPTOR relacionado que señala en el ATRIBUTO "Penthouse". Eso es bastante fácil. ¿Pero qué ocurre si su búsqueda aparece vacía?

La ventaja de este enfoque es que puede aflojar sus criterios diciendo: "vamos a subir la jerarquía de atribución a la siguiente cosa menos específica que penthouse". En mi ejemplo, eso sería "Highrise". Ahora prueba tu búsqueda nuevamente y es posible que tengas mejor suerte.

Un sistema como este le da la capacidad de ser tan específico como desee en cada categoría de atribución mientras relaja los otros lo suficiente como para comenzar a obtener resultados de búsqueda. De esto se trata realmente el trabajo de un agente inmobiliario, ¿no es así? ¿Ayuda al cliente a hacer los compromisos necesarios para encontrar el mejor ajuste a sus criterios más importantes?

Manejo anidada Establece

La única parte difícil de este enfoque es cómo manejar los conjuntos anidados. Hay muchas formas de hacerlo, muchas de las cuales han sido documentadas exhaustivamente en otros lugares. A mí me gusta la técnica visitation number, especialmente para conjuntos de datos relativamente estáticos. Esto hace que sea muy fácil encontrar coincidencias para un ATRIBUTO dado o cualquiera de sus hijos sin tener que hacer nada exótico en su SQL.

EDITAR: ¿Cómo funciona esto?

OP pregunté cómo se maneja la cantidad de habitaciones y cómo son las consultas? Tomemos otro ejemplo para la ilustración:

Bedroom Example

Lo anterior muestra los conjuntos anidados en la categoría "Número de dormitorios". También agregué los números de visita al diagrama. Tenga en cuenta la forma en que funcionan los números de visita, en particular, tenga en cuenta que los números de la izquierda (verde) y derecho (rojo) para cualquier valor de atributo dado contienen los números de visita izquierda y derecha para cualquier atributo subordinado. Por ejemplo, "2+ dormitorios" tiene números izquierdo y derecho 6 y 15 respectivamente. Cada atributo que corresponde a "2+ habitaciones" tiene números de izquierda y derecha que se encuentran dentro de este rango.

Entonces, ¿cómo consultaría las propiedades con un descriptor dado? Digamos que queremos encontrar todas las propiedades con dos o más habitaciones. El SQL para dicha consulta podría ser algo como esto:

select P.* 
from PROPERTY P 
    inner join DESCRIPTOR D 
    on P.id = D.property_id 
    inner join ATTRIBUTE A 
    on D.attribute_id = A.id 
where A.left >= (select X.left from ATTRIBUTE X 
       where X.name = '2+ Bedrooms') 
    and A.right <= (select Y.right from ATTRIBUTE Y 
        where Y.name = '2+ Bedrooms') 

Tenga en cuenta que la consulta anterior es un poco diferente que lo que se podría utilizar realmente. Por ejemplo, probablemente busque el atributo de filtrado utilizando su clave de identidad int en lugar de su nombre de cadena. Sin embargo, pensé en dejarlo como se muestra para mayor claridad alrededor del punto principal, que es el filtro mirando no para un atributo relacionado específico, pero para cualquier atributo relacionado que caiga dentro de su filtro rango.

Si desea filtrar en múltiples atributos, simplemente agregue más sub-cláusulas a su cláusula where.

+0

Creo que está en el camino correcto allí (+1 para los diagramas agradables también) - pero de alguna manera, todavía no lo "entiendo" en términos de cómo podría poner esto en práctica, es decir, 1. Diseñar un esquema 2. Ejecute una consulta de muestra en este esquema. Estoy particularmente luchando con la forma en que la categoría también se puede usar para algo así como el número de habitaciones (así como el tipo de propiedad), y cómo puedo buscar, por ejemplo, áticos de 2 dormitorios en un código postal dado. – oompahloompah

+0

Y si la consulta del penthouse no arroja ninguna coincidencia, ¿qué clase de declaración SQL emitiría para decirle al DB que busque registros para el siguiente nivel? Perdón por sonar tonto, pero quiero asegurarme de hacerlo bien la primera vez. – oompahloompah

+0

Consulte mi edición sobre cómo manejar cosas como la cantidad de habitaciones y el aspecto del SQL. En cuanto a cómo retroceder a una búsqueda menos restrictiva, lo que haría sería buscar el atributo de filtrado original, decir "Penthouse" y usarlo como FK para "ATTRIBUTE" para encontrar el siguiente valor de atributo más amplio, que en este caso es " Highrise ", luego repites la consulta con" Highrise "y espero que encuentres algunos éxitos. –

Cuestiones relacionadas